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(57) Abstract 

The invention concerns a novel nucleic sequence and deduced protein sequence family with whole or partial human endogenous 
retroviral motifs. The invention also concerns the detection and/or the use of said nucleic sequences and said corresponding protein 
sequences or fragments of said sequences, for diagnostic, prophylactic and therapeutic uses, in particular for neuropathological conditions 
with autoimmune constituent such as multiple sclerosis. Said purified nucleic acid sequences comprise all or part of a sequence coding for 
a human endogenous retroviral sequence having at least env-type retroviral motifs, corresponding to the sequence SEQ ID NO: 1 or to a 
sequence having a homology level with said sequence SEQ ID NO:l not less than 80 % on more than 190 nucleotides or not less than 70 
% on more than 600 nucleotides for env-type domains. The invention further concerns the use of the flanking or adjacent sequences of 
said sequences and controlled by the latter, as diagnostic reagents. 



(57) Abrege 

Nouvelle famille de sequences nucldiques et de sequences prot6iques d6duites, qui pr6sentent des motifs r6troviraux endog6nes 
humains complets ou partiels. Detection et/ou utilisation desdites sequences nucleiques et desdites sequences proteiques correspondantes 
ou de fragments de ces sequences, dans le cadre d' applications diagnostiques, prophylactiques et th6rapeutiques, en particulier pour des 
neuropathologies a composante autoimmune comme la scl6rose en plaques. Lesdites sequences d'acide nucleique purifie comprennent tout 
ou partie d'une sequence codant pour une sequence retrovirale endog6ne humaine, qui pr6sente au moins des motifs r6troviraux de type 
env, repondant a la sequence SEQ ID NO: 1 ou a une sequence pr6sentant un niveau d'homologie avec ladite sequence SEQ ID NO: 1 
superieur ou 6gal a 80 % sur plus de 190 nucl6otides ou sup6rieur ou egal a 70 % sur plus de 600 nucleotides pour les domaines de type 
env. Utilisation des sequences flanquantes ou adjacentes desdites sequences et controlees par ces dernieres, comme reactifs de diagnostic. 
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FAMILLE DE SEQUENCES NUCLEIQUES ET DE SEQUENCES PROTEIQUES DEDUITES PRESENTANT DES MOTIFS 
RETRO VIRAUX ENDOGENES HUMAINS, ET LEURS APPLICATIONS 

5 La presente invention est relative a une nouvelle famille de 

sequences nucleiques et de sequences proteiques deduites, qui presentent des motifs 
retroviraux endogenes humains complets ou partiels. ainsi que des sequences 
flanquantes ou adjacentes desdites sequences, et controlees par ces dernieres : modifi- 
cation de 1' expression ou alteration de la structure (polyadenylation, epissage alter- 

1 0 natif . . . ) desdites sequences flanquantes. 

1/ invention est egalement relative a la detection et/ou a rutilisation 
desdites sequences nucleiques et desdites sequences proteiques correspondantes. dans 
le cadre d' applications diagnostiques, prophylactiques et therapeutiques. en particulier 
pour des neuropathologies a composante autoimmune comme la sclerose en plaques. 

15 [/invention concerne aussi l'obtention de sondes nucleiques double 

brins et simple brin anti-sens, de ribozymes, aptes a moduler la replication virale (T.R. 
Cech, Science, 1987, 236, 1532-1539 ; R.H. Symons. Trends Biochem. ScL, 1989. 14, 
445-450) des molecules recombinantes correspondantes, et des anticorps associes. 

Les retrovirus sont des virus qui se repliquent uniquement en utili- 

20 sant la voie inverse du traitement classique de Tinformation genetique. Ce processus, 
nomme transcription inverse, est medie par une ADN polymerase ARN dependante ou 
transcriptase reverse, codee par le gene pol Les retrovirus codent aussi au minimum 
pour deux genes additionnels. Le gene gag code pour les proteines du squelette, ma- 
trice, nucleocapside et capside. Le gene env code pour les glycoproteins d'enveloppe. 

25 La transcription retroviral est regulee par des regions promotrices ou " enhancers 
situees dans des regions hautement repetees ou LTR {Long Terminal Repeat) et qui 
sont presentes aux deux extremites du genome retroviral. 

Lors de Tinfection d'une cellule, la polymerase fait une copie ADN 
du genome ARN ; cette copie peut alors s'integrer dans le genome humain. Les retro- 

30 virus ne tuent pas les cellules qu'ils infectent, mais au contraire ameliorent souvent 
leur rapidite de croissance. Les retrovirus peuvent infecter des cellules germinales ou 
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des embryons a un stade precoce ; ils peuvent dans ces conditions, integrer la lignee 
germinale et etre transmis par transmission mendelienne verticale. ce qui constitue la 
relation la plus etroite entre un hote et son parasite. Ces virus endogenes peuvent 
degenerer au cours des generations de Porganisme hote et perdre leurs proprietes ini- 
5 tiales. Cependant certains d' entre eux peuvent conserver tout ou partie de leurs pro- 
prietes ou des proprietes des motifs les composant, ou encore acquerir de nouvelles 
proprietes fonctionnelles presentant un avantage pour Torgamsme hote, ce qui expli- 
querait la preservation de leur sequence. 

U existence de motifs endogenes presentant de longs cadres de 

10 lecture ouverts et/ou soumis a une forte pression de selection peut done etre indicatrice 
d'une fonction biologique preservee ou acquise, qui peut correspondre a un benefice 
pour forganisme hote. Ces sequences retrovirales peuvent aussi subir, au cours des 
generations, des modifications discretes qui vont etre a meme de reveiller certaines de 
leurs potentialites et engendrer ou favoriser des processus pathologiques. II est apparu 

15 recemment necessaire de faire le bilan et d ? identifier ces sequences afin de pouvoir 
e valuer leur impact fonctionnel. 

Les sequences retrovirales endogenes humaines ou HERVs repre- 
sentent une part importante du genome humain. Ces regions retrovirales se presentent 
sous plusieurs formes : 

20 - des structures retrovirales endogenes completes associant des 

motifs gag, pol et env, flanques de sequences nucleiques repetees, qui montrent une 
analogie significative avec la structure LTR-gag-pol-env-LTR des retrovirus infec- 
tieux, 

- des sequences retrovirales tronquees ; par exemple, les retro- 
25 transposons sont prives de leur domaine env et les retroposons ne possedent pas les 

regions env et LTR. 

Jusqu'a present l'etude de ces regions du genome a ete negligee chez 
1 'Homme pour deux raisons essentielles : 

- 1' existence d' insertions/deletions qui peuvent decaler le cadre de 
30 lecture et de mutations qui modifient la sequence. Ces modifications entrainent des 

alterations de la structure et par consequent de la fonction biologique de ces motifs. 



WO 99/67395 PCT/FR99/01513 

J> 

- F absence dissociations averees avec des pathologies humaines. 
La connaissance, recente de fragments significativement representa- 
tifs du genome humain et une orientation des recherches vers une etude struc- 
ture/fonction des motifs retroviraux endogenes, ont permis de preciser Hnteret de ces 
regions. L' implication de sequences endogenes tronquees ou completes dans des 
pathologies chez r animal est documentee ; par exemple leur association avec des 
processus tumoraux a ete clairement mise en evidence (S.K. Chattopadhyay et coll.. 
1982, Nature, 295, 25-31). Une recherche visant a preciser F association ou Finfluence 
des HERVs dans des pathologies humaines se justifie done aujourd'hui. 

Une classification des elements HERV a ete proposee (Tonjes R.R. 
et al., AIDS & Hum. Retroviral, 1996, 13, S261-S267; A.M. Krieg et ah. FASEB J.. 
1992, 6, 2537-2544). Elle est basee sur une homologie de ces sequences avec des 
retrovirus isoles chez les animaux, a l'aide de sondes retrovirales heterologues. En 
effet, en general, les HERVs presentent relativement peu d'homologie avec des retro- 
virus infectieux humains connus. 

Les families de classe I presentent une homologie de sequence avec 
les retrovirus de mammiferes de type C ; on peut citer notamment la superfamille ERI, 
proche du virus MuLV {murine leukemia virus) et du virus BaEV {baboon endoge- 
nous virus). 

Les families de classe II presentent une homologie de sequence avec 
les retrovirus de mammiferes de type B tel que le MMTV {mouse mammary tumour 
virus) ou les retrovirus de type D tel que le SRV {squirrel monkey retrovirus). 

D'autres families ont egalement ete decrites ; parmi celles-ci, on peut 
citer des HERVs qui presentent, de maniere exceptionnelle, une homologie partielle 
avec HTLV-1 (RTVL-H) ou des virus de primates ; HRES-1, par exemple, presente 
une homologie de sequence avec des HTLVs. 

Les programmes de tres grand sequen?age du genome humain per- 
mettent aujourd'hui de disposer d'un nombre significatif de nouvelles sequences retro- 
virales. L'usage de logiciels de traitement de donnees permet d* identifier et d' analyser 
ces genes. Dans ce contexte une recherche systematique portant sur V ensemble des in- 
formations disponibles a ce jour a ete engagee afin d' identifier de nouvelles sequences 
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retro virales endogenes humaines en fo notion de certains cri teres d* analyse : 

- presence de longs cadres de lecture ouverts conserves au cours de 
1'evolution de forganisme hote et pouvant laisser envisager une fonction biologique, 

- analogie avec des sequences deja caracterisees en dehors ou dans le 
5 domaine des retrovirus, 

- localisation dans des regions de susceptibilite pour certaines patho- 
logies ou a proximite de genes essentiels, par exemple dans les domaine du cancer, des 
regulation du systeme immunitaire ou dans certaines neuropathologies. 

Les recherches effectuees par les Inventeurs. dans des bases de don- 
10 nees de sequences leur ont permis d' identifier un ensemble de sequences ou de motifs 
retro viraux endogenes dont F expression normale ou pathologique peut favoriser ou 
perturber un effet protecteur vis-a-vis de processus pathologiques, ou intervenir dans 
le declenchement ou l'aggravation de pathologies. 

La presente invention a pour objet un fragment d'acide nucleique 
15 purifie, caracterise en ce qu'il comprend tout ou partie d'une sequence codant pour une 
sequence retrovirale endogene humaine, qui presente au moins des motifs retroviraux 
de type env, repondant a la sequence SEQ ID NO:l ou a une sequence presentant un 
niveau d'homologie avec ladite sequence SEQ ID NO:l superieur ou egal a 80% sur 
plus de 190 nucleotides ou superieur ou egal a 70 % sur plus de 600 nucleotides pour 
20 les domaines de type env. 

On entend par sequence homologue, aussi bien une sequence qui 
presente une identite complete ou partielle avec la sequence SEQ ID NO:l precitee 
qu'une sequence qui presente une similarite partielle avec ladite sequence SEQ ID 
NO:L 

25 Selon un mode de realisation avantageux dudit fragment, il presente 

a la fois des motifs retroviraux correspondant a un domaine env et repondant a la 
sequence SEQ ID NO:l et des motifs retroviraux correspondant a un domaine gag et 
repondant a la sequence SEQ ID NO:2 ou a une sequence presentant un niveau 
d'homologie superieur ou egal a 80 % sur plus de 190 nucleotides ou superieur ou 

30 egal a 70 % sur plus de 600 nucleotides pour les domaines de type env et un niveau 
d'homologie superieur ou egal a 90 % sur plus de 700 nucleotides ou superieur ou 
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egal a 70 % sur plus de 1200 nucleotides pour les domaines de type gag, lesquels 
motifs ne presenters aucune insertion ou deletion de plus de 200 nucleotides. 

Lesdits fragments constituent une nouvelle famille de sequences 
retrovirales endogenes humaines (famille HERV-7q) qui presente une homologie de 
5 sequence avec les retrovirus MSRV, tels que decrits dans la Demande Internationale 
WO 97/06260 ; lesdits fragments selon la presente invention presentent : 

- deux motifs nucleotidiques repetes de 71 1 pb (figure 3), presentant 
des signaux caracteristiques identifies dans des LTRs {Long Terminal Repeats) : 
promoteurs de transcription de type boites TATAA ou CCAAT. Ces domaines repetes 

10 encadrent trois motifs deduits de type-gag, pol et env (figure 2). 

- un motif de type env (positions 6965 nt - 9550 nt sur la sequence 
SEQ ID NO :3 ou sur la figure 1) qui contient un long cadre de lecture ouvert de 1620 
nucleotides (positions 7874-9493 de la sequence ID NO:3 et figure 1), codant pour 
une proteine de sequence inedite de 540 acides amines appelee enverine (figure 4 et 

15 SEQ ID NO:26) et fragment souligne de la figure 18. On retrouve a Tinterieur du 
domaine trans-membranaire de ce domaine env, un motif peptidique de type CKS- 
25/CKS-17 (figure 5), reconnu pour presenter des fonctions immunosuppressives sur 
les cellules lymphocytaires hotes (M. Mitani et coll., 1987, Proc. Natl Acad. Set 
USA, 84, 237-240). Un domaine de type doigt de zinc {zinc-finger) HX 3 ^HX 2 2- 

20 33 CX 2 C (Kulkolski et coll., 1992, Mol Cell Biol, 12, 2331-2338), que Ton retrouve 
dans des domaines de type integrase est identifie dans un autre cadre de lecture. Ce 
domaine env particulier signe la caracteristique de nouveaux motifs retroviraux 
endogenes. 

- le motif (positions 3065 nt - 4390 nt sur la sequence SEQ ID NO:3) 
25 de type-gag codant pour des motifs proteiques selon la figure 6 (SEQ ID NO:58) 

(positions 3118-4198 de la SEQ ID NO:3) a ete identifie grace a des analogies avec 
des domaines gag connus. On retrouve, par exemple, la region d'homologie majeure 
QX 3 EX 7 R (Benit et coll., 1997, J. Virol, 71, 5652-5657). Le motif de fixation des 
acides nucleiques CX 2 CX3^HX4C, situe en position C-terminale, est identifie dans un 
30 autre cadre de lecture (Covey et coll., 1986, Nucleic Acids Res., 14, 623-633). En 
amont du domaine gag on detecte un motif de 182 nucleotides repete deux fois (figure 
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1). 

- le domaine pol presente les consensus classiques cTiine region pol 
de retrovirus au niveau des domaines protease, transcriptase reverse et RNAse H. On 
retrouve dans pol un motif proche du consensus LLDTGA (Weber et coll.. 1988, 

5 Science, 243, 928-931). Les motifs D et AF, LPQ et SP, et YVDD (Xiong et 
Eickbush, 1990, EMBO J., 9, 3353-3362), sont respectivement retrouves dans les 3°, 
4° et 5° boites d'homologie. Les motifs YTDGSS et TDS sont presents dans la region 
de la RNAse H, 

- les regions gag et pol pourraient etre considerees comme jointives 
10 avec un passage de la region gag a la region pol par un decalage du cadre de lecture. 

La presente invention englobe les sequences appartenant a la famille 
HERV-7q telle que definie ci-dessus (presence de la sequence SEQ ID NO:l ou d'une 
sequence homologue ou presence a la fois des sequences SEQ ID NO:l et SEQ ID 
NO:2) et notamment les sequences SEQ ID NO:3-22, 28 et 61 ; elle englobe egale- 
15 ment les sequences nucleiques complementaires et les sequences inverses comple- 
mentaires des sequences precedentes ainsi que les fragments issus des regions 
codantes des sequences precedentes correspondant a un cadre glissant superieur ou 
egal a 14 nucleotides ou leurs sequences complementaires. (SEQ ID NO :37-57, 59-60 
et 121-122). 

20 Ces differents fragments peuvent avantageusement etre utilises 

comme amorces ou comme sondes (reactifs A) ; ils s ? hybrident specifiquement dans 
des conditions de forte stringence a une sequence de la famille HERV-7q. 

Parmi ces fragments, on peut citer, de preference les fragments 

suivants: 

25 - un fragment de 182 nucleotides repete deux fois, situe en amont du 

domaine gag aux positions 2502-261 1/2613-2865 de la SEQ ID NO:3 ; 

Amorces et sondes specifiques de la region gag 

- une amorce GIF, sens, localisee dans la region amont du domaine 
gag de HERV-7q : 5' GGACCATAGAGGACACTCCAGGACTA 3' 

30 (SEQ ID NO:37); 

- une amorce G1R, anti-sens, localisee dans la region 3' terminale du 
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domaine gag : 5' CCTCAGTCCTGCTGCTGGATCATCT 3' (SEQ ID NO:38) 

- le fragment de 1505 nt amplifie par le couple G1F-G1R est utilise 
afin de generer les sondes aptes a hybrider les differents produits d"amplification des 
PCR; 

5 - une amorce G2F, sens nichee : (SEQ ID NO:39) 

5' CCTCCAAGCAGTGGGAGGAAGAGAATT 3" 

- une amorce G2R, anti-sens nichee : (SEQ ID NO:40) 
5' CCTTCCCTGTGTTATTGTGGACATCATT 3' 

- une amorce G4F, sens nichee : (SEQ ID NO:41) 

10 5 ' GGAAGAAGTCTATGAATTATTC AATG ATGT 3 - 

- une amorce G3F, sens nichee: (SEQ ID NO:42) 

5' GGGACACAGAATCAGAACATGGAGATT 3' 

- une amorce G4R, anti-sens nichee : (SEQ ID NO:43) 
5' GCCTTCAGAAGAGTCAGGTGACAGAGA 3' 

15 - une amorce G5R, anti-sens nichee : (SEQ ID NO:44) 

5 ' GAGCCTCC AAAGTCC ACTTGCCTGA 3' 
Amorces et sondes specifiques de la region env 

- une amorce E1F, sens : (SEQ ID NO:45) 

5' GATTTCAGTATCTACTAGTCTGGGTAGAT 3' 
20 - une amorce E1R, anti-sens : (SEQ ID NO:46) 

5' CTAGGAAATCCAGCTAGTCCTGTCTCA 3' 

- le fragment de 2529 nt amplifie par le couple d'amorces E1F-E1R, 
est utilise afin de generer les sondes aptes a hybrider les differents produits 
d' amplification des PCR. 

25 - une amorce E2F, sens : (SEQ ID NO:47) 

5' CCAAGACAGCCAACTTAGTTGCAGACAT 3' 

- une amorce E2R, antisens : (SEQ ID NO:48) 

5' GGACGCTGCATTCTCCATAGAAACTCTT 3' 

- une amorce E3F, sens : (SEQ ID NO:49) 

30 5' GCAATACTACATACACAACCAACTCCCAA 3' 
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- une amorce E3R, anti-sens : (SEQ ID NO:50) 

5' GGGGGAGGCATATCCAACAGTTAGTA 3' 

- une amorce E4F, sens : (SEQ ID NO:51) 

5' CCATCTACACTGAACAAGATTTATACACTT 3' 
5 - une amorce E4R, anti-sens : (SEQ ID NO:52) 

5' AATGCCAGTACCTAGTGCACCTAGCACT 3 ' 

- une amorce E5F, sens : (SEQ ID NO:53) 

5' CGAATACAACGTAGAGCAGAGGAGCTTCGAA 3' 

- une amorce E6F, sens : (SEQ ID NO:54) 

10 5 ' AGCCC AAG ATGC AGTCC AAGACTAAGAT 3 9 

- une amorce E5R : (SEQ ID NO:55) 

5 ' GCGTAGT AG AGGTTGTGC AGCTG AG AT 3' 

- une amorce ExF : (SEQ ID NO:56) 
CCCTTACCAAGAGTTTCTATGGAGAAT 

15 - une amorce ExR : (SEQ ID NO:57) 

ACCGCTCTAACTGCTTCCTGCTGAATT 

Tous les oligonucleotides sont con?us pour pouvoir generer une 
amorce sens et une amorce anti-sens par un decalage de la sequence de 1' amorce de 
reference de 1 a 7 nucleotides vers le cote 5' ou vers le cote 3 ? : la modification de la 

20 sequence peut entrainer une modification de la taille de V amorce de 1 a 7 nucleotides 
selon les cas. Les amorces choisies peuvent etre optimisees selon les cas par un 
raccourcissement ou un allongement portant sur 1 a 9 nucleotides. 

De maniere preferee, l'hybridation, le clonage, le sous-clonage, 
l'obtention, la preparation et l'analyse des acides nucleiques, des peptides et des anti- 

25 corps, le sequen9age des acides nucleiques et des peptides, Thybridation in situ et 
1'immunohistochimie sont realises dans les conditions decrites dans les ouvrages 
suivants : 

- Current Protocols in Molecular Biology. Eds. F.M Ausubel, R. 
Brent & R.E Kingston et coll. Green Publishing associates and Wiley Interscience. 

30 - Molecular Cloning: a laboratory manual. Eds. J. Sambrook, E.F. 

Fritsch & T. Maniatis. Cold Spring Harbor Laboratory Press. Cold Spring Harbor. 
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- The Practical Approach series. Eds. D. Rickwood & B.D. Ames. 
IRL Press and Oxford University Press. En particulier, antibodies I & II; DNA cloning 
I, II, III; Nucleic acid and protein sequence analysis; Nucleic acid hybridization; 
Nucleic acid sequencing ; Oligonucleotide synthesis; Protein purification applications; 

5 Protein purification methods; Protein sequencing; Transcription and translation; Gels 
electrophoresis of nucleic acids; Gels electrophoresis of proteins; Genome analysis; 
HPLC of macromolecules; Human genetic diseases; Microcomputing in biology; 
Molecular neurobiology; Mutagenicity testing; Essential molecular biology I & II. 

- Proteome research: New frontiers in functional genomics. Eds 
10 M.R. Wilkins & coll.. Springer. 

La sequence retroviral endogene humaine (SEQ ID NO:3). situee 
sur le bras long du chromosome 7 correspond a la sequence HERV-7q ; elle presente 
10,5 kb (fig. 1 et 2) et repond aux criteres precedemment defmis. 

La recherche de domaines presentant des similitudes, tout ou partie, 

15 avec les regions gag et env de HERV-7q a abouti a T identification de nouvelles 
sequences retrovirales endogenes. Ces sequences peuvent presenter la structure d ? un 
retrovirus endogene complet comme la sequence retroviral endogene situee a proxi- 
mite du gene des sous-unites alpha et delta du recepteur des cellules-T, et denommee 
en consequence HERV-TcR ; a titre d'exemple la figure 7 montre la comparaison des 

20 alignements nucleiques des domaines gag respectifs de HERV-7q et HERV-TcR 
(sequence HG12, SEQ ID NO: 19). On trouve aussi des structures retrovirales 
partielles. Ces domaines retroviraux similaires a HERV-7q sont identifies dans des 
sequences nucleiques independantes comme le montre leur localisation chromo- 
somique. Des motifs nucleiques (appeles ici, HEx ou HGx et respectivement analo- 

25 gues a des domaines de type env ou gag) ressemblant aux domaines env ou gag de 
HERV-7q ont ete retrouves, a Taide des banques de donnees precitees : 

- HE2 : chromosome 17 (SEQ ID NO:4), 

- HE3 et HG3: chromosome 6 (SEQ ID NO:5 et 6), 

- HE4 : chromosome X (SEQ ID NO:7), 

30 - HE5 : chromosome X q22 (SEQ ID NO:8), 

- HE6 et HG6 : chromosome 1 q23.3-q24.3 (SEQ ID NO:9 et 10), 
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- HE7 : chromosome 7 pl5 (SEQ ID NO: 1 1), 

- HE8 et HG8 : chromosome 19 (SEQ ID NO: 12 et 13). 

- HE9 : chromosome X (SEQ ID NO: 14), 

- HE 1 0 : chromosome X q 1 3 . 1 -2 1 . 1 (SEQ ID NO : 1 5 ), 

5 - HE 1 1 et HG 1 1 : chromosome 7 q2 1 -22 (SEQ ID NO : 1 6 et 1 7), 

- HE12 et HG12, dans HERV-TcR : chromosome 14 ql 1.2 (SEQ ID 

NO:18et 19), 

- HE 13 (SEQ ID NO:61) : chromosome 6 q24. 1-24.3 

La presente invention englobe egalement les fragments codants et 
10 non codants pour tout ou partie de l'enverine comprenant au moins 14 nucleotides et 
notamment les fragments codant pour la partie C-terminale de l'enverine, soit a partir 
de l'acide amine 291, soit a partir de l'acide amine 321, a compter de la premiere 
methionine. 

Ces fragments comprennent en particulier une zone critique ou deux 
15 insertions de 12 nucleotides ont ete caracterisees : 

- une premiere insertion a ete identifiee (sequence A), chez des indi- 
vidus de 2 groupes (malades et temoins). Cette insertion situee entre les acides amine 
487 et 488, permet d'inserer le tetrapeptide VLQM. Une analyse comparative montre 
que cette insertion est identifiee dans une region homologue situee dans la sequence 

20 HE13, appartenant a la famille HERV-7q. L' amplification de la sequence de type 
HE 13, pourrait indiquer qu'il existe une alteration de la sequence de l'enverine de 
HERV-7q, ce qui favoriserait 1' amplification de la sequence contenue dans HE13. 
Cette observation permet aussi d'utiliser cette insertion comme element specifique 
d' amplification de sequences de type HE13. 

25 Une deuxieme insertion (sequence B) a ete identifiee chez un patient 

presentant une SEP. L'insertion de 12 nucleotides est situee au niveau de l'acide 
amine 495 et code pour le tetrapeptide MQSM. II est remarquable de constater que 
cette insertion est aussi identifiee dans une region homologue situee dans HE13. 

Sequence A: TAAACTACAAATGG TTCTTCAAATGG AGCCCA 

30 (SEQ ID NO:59) 
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Sequence B: GATGCAGTCCAAGA TGCAGTCCATGA CTAAGA 

(SEQ ID NO:60). 

Ces observations mettent en evidence des modifications de la 
sequence de l'enverine de type HERV-7q qui constituent la base d'une strategic de 
5 detection par amplification specifique d' alleles (AS-PCR), permettant de detecter ces 
differences dans une population et qui pourraient corresponds soit a une muta- 
tion/deletion associee a une certaine susceptibilite, soit a un polymorphisme, soit a une 
mutation/deletion associee a une pathologic comme la sclerose en plaques. 

Les alignements des domaines env (fig. 8) et gag (fig. 9) explicitent 
10 les niveaux d'homologie observes entre les sequences decrites ci-dessus et les sequen- 
ces homologues dans HERV-7q. Les analogies peuvent s'etendre aux motifs retro- 
viraux flanquants. 

Une analyse des sequences etiquettes disponibles dans les banques 
de donnees montre que des transcrits appartenant a certains des membres de cette 
15 famille, en particulier HERV-7q, s'expriment essentiellement dans des tissus d'origine 
foetale ou placentaire. 

Des sequences polypeptidiques generees par ces transcrits peuvent 
done etre potentiellement produites et des fonctions ou activites biologiques peuvent 
etre envisagees, par analogie avec des polypeptides biologiquement actifs d'origine 
20 virale ou retroviral ; par exemple, les motifs peptidiques de type CKS-17 (Haraguchi 
et al., PNAS, 1995, 92, 5568-5571) (fig. 5) ou CKS-25 (Huang S.S et Huang J.S, J. 
Biol. Chem. 1998, 273, 4815-4818), qui presentent des fonctions immunomodulatrices 
sur les cellules lymphocytaires hotes. Les differences de sequence observees et 
d'eventuelles modifications normales ou pathologiques, sont en particulier, a l'origine 
25 d'une modulation de la fonction. 

HERV-7q represente le paradigme de la nouvelle famille de 
sequences retrovirales endogenes humaines ou de motifs retroviraux endogenes. 

HERV-7q et certaines des sequences retrovirales endogenes apparte- 
nant a sa famille, presentent un domaine de type pol analogue a des sequences retro- 
30 virales de type pol comme par exemple la region pol identifiee dans le retrovirus 
MSRV associe a la sclerose en plaques et decrit par H. Perron et al. (1997, Proc. Natl 
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Acad Sci. USA, 94, 7583-7588 ; Demande Internationale PCT WO 97/06260). 

Toutefois, les sequences selon la presente invention se distinguent 
des sequences retrovirales exogenes infectieuses analogues a MSRV anterieurement 
decrites en ce que les sequences gag et env, selon V invention sont significativement 
5 differentes selon les criteres precedemment definis et en fonction de certaines caracte- 
ristiques specifiques, par exemple le long cadre de lecture ouvert du domaine env de 
HERV-7q ; elles seraient a meme de permettre de signer une pathologie lorsqu'elles 
presentent des insertions, des deletions, des decalages de cadre de lecture ou des 
mutations. 

10 En effet, les differences observees entre les sequences humaines de 

type HERV-7q, qui sont isolees d'individus reputes normaux et les sequences issues 
de certains echantillons d'origine pathologique, ne sont pas distributes au hasard. Des 
comparaisons menees entre la region gag provenant de particules retrovirales infec- 
tieuses (N° d'accession EMBL: A60168, A60200, A60201, A60171...) et la sequence 

15 gag correspondante de HERV-7q (fig. 9), permettent d'observer que les mutations 
affectent preferentiellement des codons non-sens. Par exemple. deux codons non-sens 
dans HERV-7q sont remplaces par un codon arginine dans A60200, ce qui permet 
d'obtenir une sequence deduite de 109 acides amines pour HERV-7q et de 166 acides 
amines pour A60200. Les changements de base permettent en consequence de prolon- 

20 ger le cadre de lecture et de coder potentiellement pour des structures polypeptidiques 
de plus grande taille (figure 10). 

De meme, une sequence de type env provenant de particules retro- 
virales infectieuses, presente une analogie significative avec le domaine env de 
HERV-7q (figure 11). Ces analogies marquees entre sequences retrovirales exogenes 

25 et endogenes pourraient etre a Torigine du declenchement ou de Faggravation de 
certains processus pathologiques, en particulier de certaines maladies auto-immunes, 
comme la sclerose en plaques. A cet egard, on peut remarquer que certaines des 
sequences retrovirales endogenes decrites dans 1' invention se situent a proximite ou 
dans des regions reputees presenter une susceptibilite pour la sclerose en plaques : par 

30 exemple HERV-7q et la region 7q21-22 du chromosome 7, de meme pour HE12 et 
HG12 dans HERV-TcR et la region du gene codant pour les chaines alpha et delta du 
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recepteur des cellules-T, HE2 et le chromosome 17, ou HE3, HE 13 et HG3 et le 
chromosome 6, par exemple, les sequences HE1 1 et HG1 1, autour de la region 7q 21- 
22 ou encore HE4, HE5, HE6, HE9, HE10 ou HG10 sur le chromosome X. Ces 
sequences seraient done a meme de fournir des moyens de localisation ou 
5 d'identification des genes de predisposition. 

On n'observe aucune homologie significative avec des sequences 
retrovirales endogenes deja decrites, par contre, on peut relever une homologie 
limitee, permettant d' identifier une structure generate de domaine env ; toutefois, 
ladite homologie est inferieure aux criteres definis selon T invention entre les 

10 domaines env de la sequence HERV-7q (SEQ ID NO :1) et de la sequence HERV-9 
(figure 12). La figure 1 1 montre des homologies etendues entre la sequence HERV-7q 
avec une sequence retro virale exogene (N° d'accession EMBL : A60170). 

Les sequences retrovirales endogenes humaines appartenant a la 
famille de HERV-7q, peuvent proteger contre des agressions liees a Tenvironnement 

15 ou constituer un benefice pour l'individu. Cet effet benefique pourrait etre une des 
raisons possibles de la pression de selection exercee sur certaines de ces sequences et 
du caractere potentiellement fonctionnel des structures proteiques deduites identi- 
fiees : par exemple le long cadre de lecture ouvert apte a coder pour une nouvelle pro- 
teine et correspondant au domaine env de HERV-7q. 

20 Les sequences retrovirales endogenes humaines appartenant a la fa- 

mille de HERV-7q pourraient etre associees par exemple, a des pathologies en relation 
avec les processus lies au cancer, aux neuropathologies a composante auto-immune ou 
a tout autre processus pathologique en association ou non avec des virus ou retrovirus 
endogenes ou exogenes. Leur action pourrait porter sur la declaration, 1' aggravation, la 

25 modification du calendrier d' apparition ou encore la protection vis a vis de la maladie. 

Dans le contexte d' application a des pathologies autoimmunes 
(comme par exemple le lupus, le syndrome de Sjogren, la polyarthrite rhumatoide, la 
sclerose en plaques...), on peut relever des analogies significatives entre les motifs re- 
troviraux endogenes identifies et des motifs retrouves dans des structures retrovirales 

30 caracterisees chez des patients presentant des pathologies autoimmunes comme la 
sclerose en plaques : par exemple des fragments de domaine gag (recemment dispo- 
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nibles dans les banques de donnees) provenant de particules retrovirales infectieuses 
ou encore la sequence complete du domaine pol correspondant au virus MSRV associe 
a la sclerose en plaques. Ces motifs retroviraux possedent des analogies significatives 
avec les sequences endogenes homologues de type HERV-7q, ce qui permet 
5 d'envisager une association directe ou indirecte avec des processus pathologiques, 
dont la sclerose en plaques, en association ou non avec MSRV. 

L'interet de ces sequences depasse le cadre des maladies auto- 
immunes. En dehors de Pimportance generale des motifs retroviraux dans le declen- 
chement ou l'aggravation d'un processus tumoral, bien montre en particulier dans les 

10 modeles murins (H. Fan dans The retroviridiae, 1994, ed. J. A. Levy, Plenum, New 
York, p. 313-353), ces sequences pourraient se retrouver a proximite ou au sein de 
genes importants et en alterer l'expression : par exemple HERV-TcR et les genes des 
sous-unites alpha et delta du recepteur des cellules T impliquees dans des perturba- 
tions de la fonction immunitaire. 

15 La presente invention englobe, en outre, l'utilisation de sequences 

associees aux sequences de la famille HERV-7q pour la detection et/ou le pronostic de 
differentes maladies auto-immunes (neuropathologies, en particulier) ; ces sequences 
codent pour tout ou partie d'un facteur, dont la fonction, la regulation/deregulation ou 
F alteration (polyadenylation, epissage alternatif) est associee a l'expression normale 

20 ou pathologique ou a la regulation/deregulation des motifs appartenant a la famille 
HERV-7q et correspondent a des transcrits ou des ADNc des sequences nucleotidiques 
codant pour des genes situes dans des regions flanquantes ou encadrant des sequences 
retrovirales de la famille HERV-7q. 

On entend par region flanquante, toute region situee a proximite 

25 (incluse dans ou incluant) une sequence retrovirale endogene appartenant a la famille 
HERV-7q, telle que definie ci-dessus, jusque et y compris les genes immediatement 
contigus et/ou situes a une distance ne pouvant exceder 120 kb. 

Les Inventeurs ont maintenant trouve que la presence des sequences 
retrovirales telles que definies ci-dessus, perturbent 1' expression ou alterent la struc- 

30 ture des sequences flanquantes definies ci-apres. 

Les transcrits desdites sequences flanquantes (et leurs fragments, 
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notamment ceux soulignes ou en italique dans les figures 14-16, 22-26, sont definies 
ci-apres : 

- a 1021 pb en amont de HERV-7q, on identifie une sequence retro 
virale endogene appelee RH7 (SEQ ID NO:62 et figure 22) ; cette sequence est situee 

5 en 5 ? de la sequence HERV-7q ; dans la figure 22, la partie en italique correspond au 
debut de la sequence HERV-7q ; la sequence RH7 est soulignee ; deux sites de 
polyadenylation putatifs sont en gras. Cette sequence SEQ ID NO:62 presente une 
homologie significative, sur plus de 6 kb, avec des sequences retrovirales endogenes 
de type RGH (figure 13). Des sequences appartenant a cette famille s ? expriment en 

10 particulier chez des patients presentant une arthrose rhumatoide (Nakagawa et coll., 
(1997), Arthritis. Rheum., 40, 627- 638). La presente invention inclut egalement des 
fragments de la sequence SEQ ID NO: 62, comprenant entre 14 et 50 nucleotides 
(utilisation comme amorces), de preference entre 14 et 25 nucleotides ou au moins 25 
nucleotides (utilisation comme sonde), lesquels fragments presentent les caracteris- 

15 tiques suivantes : les 4 nucleotides de Fextremite 3' sont differents des motifs corres- 
pondent de la sequence RGH2 (sequence du bas dans la figure 13, n° accession a 
GenBank:D110 18). 

- a moins de 9 kb en amont de HERV-7q, on identifie la sequence 
RAM75 (SEQ ID NO:63 et figure 14) contenant les 24 exons codants (qui couvrent 

20 pres de 41 kb), du gene de l'ATPase peroxysomale PEX1. PEX1, en association avec 
PEX6 est responsable de F importation des proteines peroxysomales et de la stabilisa- 
tion du recepteur PEX5. Une perturbation/alteration affectant PEX1 est responsable de 
di verses neuropathologies comme le syndrome de Zellweger, Fadrenoleucodystrophie 
neonatale et la forme infantile de la maladie de Refsum (Reuber et coll., (1997), 

25 Nature Genet, 17, 445- 448). On peut rappeler que la fonction principale des peroxy- 
somes est associee au metabolisme des acides gras, en particulier par des processus de 
p-oxydation. Une alteration du gene identifie dans la sequence RAM75 ou de son 
expression, par modification de la fonction des regions 5 ' et 3 ' regulatrices ou encore 
par modification des epissages ou des processus de polyadenylation, en particulier 

30 sous l'influence de motifs retroviraux voisins, seraient a meme de perturber 
F expression ou la structure de l'ATPase et par consequent de perturber une des 
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fonctions peroxysomales, en particulier le metabolisme des lipides, en particulier 
myeliniques, avec des consequences pour certaines pathologies, dont des neuropatho- 
logies, comme la sclerose en plaques ; les parties soulignees (figure 14) correspondent 
aux 24 exons codants. 

5 La presente invention inclut egalement les fragments de la sequence 

SEQ ID NO:63, inclus dans les 24 exons codants precites et comprenant au moins 14 
nucleotides. 

L'analyse du profil d'expression (transcrits et proteines) de la 
sequence RAM75 (SEQ ID NO:63) est un bon indicateur du diagnostic differentiel des 
10 neuropathologies a composante auto-immune. 

A la figure 14, les exons codants sont soulignes. Les codons 
d' initiation et non-sens ainsi que les sites putatifs de polyadenylation sont en gras et 
soulignes. 

- a 0.7 kb en aval de la sequence HERV-7q et sur pres de 17 kb 
15 (SEQ ID NO:64 et figure 15), on identifie la sequence nucleotidique RAV73, ou Ton 

detecte des sequences etiquettes et des exons potentiels aptes a produire une ou 
plusieurs sequences polypeptidiques ; V invention inclut egalement des fragments de 
cette sequence SEQ ID NO: 64 compris dans les sequences etiquettes et les exons 
potentiels tels qu'ils apparaissent (parties soulignees) a la figure 15, lesquels 
20 fragments comportent au moins 14 nucleotides. 

- a 120 kb en amont de la sequence HG3, et sur 15 kb, se trouve la 
sequence nucleotidique RJBP3 (SEQ ID NO:65 et figure 23), qui couvre Lextremite 
3'du gene codant pour un facteur de transcription de la famille Blimp- 1 (SEQ ID 
NO: 119 et figure 25), une proteine de 789 acides amines qui est un represseur de 

25 L expression du gene de Tinterferon-beta (Keller et Maniatis, Genes Dev., (1991), 5, 
868-879), qui est deja associe a certaines pathologies malignes (Mock et coll., 
Genomics, (1996), 37, 24-28), et qui pourrait jouer un role dans la differenciation et la 
pathogenese des cellules B. L'interet de 1' association possible de la sequence retro- 
virale endogene contenant les motifs HG3 et HE3 et de Blimp- 1 est multiple, dans le 

30 cas de pathologies, et en particulier la sclerose en plaques. Blimp- 1 agit en particulier 
sur les cellules B dont on connait la contribution dans les processus inflammatoires 
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associes a la sclerose en plaques. Blimp- 1 est capable de bloquer 1' induction virale du 
promoteur INFP dont on connait Taptitude a reduire la frequence des poussees et la 
progression lesionnelle chez des patients atteints de SEP. line perturbation de 
l'expression ou de la structure de Blimp- 1, en relation avec un element retroviral de 
5 type HERV-7q, est associee en consequence a des neuropathologies ou a des maladies 
a caractere auto-immun, comme la sclerose en plaques ; cette sequence nucleotidique 
RBP3 (SEQ ID NO:65) contient des motifs nucleotidiques identifies dans la sequence 
nucleique codant pour le gene Blimp-1 ; l'invention inclut aussi la detection des 
sequences ARNm de la proteine Blimp-1 (SEQ ID NO:l 19). 

10 - la sequence retro virale endogene de type HERV-7q, contenant HE3 

et HG3 ? se trouve situee dans la region HI3 correspondant a un intron s'etendant sur 
plus de 46 kb (SEQ ID NO:66), d'un gene qui pourrait coder pour F analogue d'APS 
(figure 24), une proteine de 275 acides amines specif! que d'apoptose, surexprimee 
dans differents cellules en culture apres declenchement d'un processus apoptotique 

15 (Hammond et coll., FEBS Lett., (1998), 425, 391- 395). L'intron se situe au niveau de 
l'acide amine 231 d'APS. L'extremite de HE3 est a plus de 12 kb de l'extremite 5' de 
l'intron, alors que HG3 est situe a plus de 28 kb de l'extremite 3' de 1' intron. Des 
processus apoptotiques sont associes a la sclerose en plaques. En particulier. il a ete 
decrit un processus apoptotique affectant des astrocytes et des oligodendrocytes en 

20 presence d'une fraction purifiee de liquide cephalo-rachidien de patients atteints de 
sclerose en plaques (Menard et coll., J. Neurol. Sci., (1998) , 154, 209- 221). 

Enfin, il faut souligner que la region nucleique contenant HE3, HG3, 
HI3 et RBP3 est localisee au niveau du bras court du chromosome 6, en 6p21, qui est 
une region proposee de susceptibilite a la sclerose en plaques (The Multiple Sclerosis 

25 Genetic Group, Nature Genet., (1996), 13, 469- 472). 

L'interaction entre les sequences de type HERV-7q et les sequences 
flanquantes et P importance de Fetablissement d'un profil d'expression incluant une ou 
plusieurs des sequences precitees pour etablir un diagnostic differentiel d'une neuro- 
pathologie apparait encore plus du fait que Ton observe que les sequences HG12 et 

30 HE 12 sont situees dans une region intronique du gene codant pour les sous-unites 
alpha et delta des recepteurs des cellules T. Les recepteurs des cellules T sont impli- 
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ques dans les processus de regulation immunitaire et leur influence a ete proposee 
dans le cas de maladies auto-immunes, dont la sclerose en plaques. 

L' invention a egalement pour objet les transcrits generes a partir des 
sequences precitees ainsi que celles presentant eventuellement des modifications avec 
5 les sequences de reference decrites dans 1' invention lorsqu'ils sont exprimes chez 
certains patients. 

En effet, les systemes de regulation de V expression des proteines 
retfovirales de HERV-7q, qui sont presents dans les motifs de type LTR, pourraient 
influencer 1'expression de genes situes dans le voisinage chromosomique proche ou 

10 eloigne et induire des perturbations a caractere immunologique et/ou neurologique. 
Par exemple la sequence retroviral endogene HERV-TcR, se trouve a proximite 
immediate des genes des sous-unites alpha et delta du recepteur des cellules-T prece- 
demment decrit. Les motifs de type LTR pourraient aussi coder pour des superanti- 
genes (Acha-Orbea et Palmer, 1991, Immunol. Today, 12, 356-361). D'une maniere 

15 generale des proteines retro virales de type HERV-7q ou apparente, ou leurs formes 
tronquees ou partielles pourraient etre impliquees dans des phenomenes de cytotoxi- 
cite ou de superanteginicite, comme par exemple celles issues du long cadre de lecture 
ouvert identifie dans le domaine env (figure 4). 

Des sequences du type des LTR 5 7 et 3 ? de HERV-7q, fortement 

20 conservees sont concernees par de tels effets regulateurs. A titre d' exemple on decrit 
LTX, une sequence comparable a celle d'une LTR de HERV-7q (SEQ ID NO:67 et 
figure 16), et qui se trouve au coeur d'un intron de plus de 49 kb, mais a 2 kb du site 5' 
donneur, du gene de FMR2 associe au X-fragile et codant pour une proteine de 1311 
acides amines (figure 26). Les LTR modulent l'epissage alternatif (Kapitonov et 

25 Jurka, (1999), J. Mol. EvoL, 48, 248- 251), 1'expression du gene, la fixation sur des 
proteines nucleaires (Akopov et colL, (1998), FEBS Lett., 421, 229- 233), ou permet- 
tent Fobtention d'un signal de polyadenylation alternatif (Goodchild et coll., (1992) , 
Gene, 121,287- 294). 

D'une maniere generale, on peut remarquer l'existence de plusieurs 

30 sequences retrovirales endogenes de type HERV-7q (HE4, HE5, HE9, HE10), situees 
au niveau du chromosome X qui represente le chromosome associe au plus grand 
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nombre de pathologies. 

A cet egard, on peut relever que des motifs retroviraux issus de 
regions defectives sont aptes a presenter des fonctions biologiques: par exemple, la 
proteine d'enveloppe pl5E issue de motifs retroviraux defectifs, possede une activite 
5 anti-inflammatoire et immunosuppressive (Snyderman et Ciancolo, 1984, Immunol 
Today, 5, 240-244). 

Ces structures sont vraisemblablement a meme de provoquer des 
breches ou d'amplifier des deregulations dans les processus de defense immunitaire. 
Certains des motifs des domaines gag, env et de type LTR peuvent etre associes a une 

10 fonction particuliere ou peuvent contribuer a la fonction normale ou pathologique des 
domaines flanquants tels que defmis ci-dessus (SEQ ID NO:62-67). Des recombinai- 
sons avec un element d'origine exogene, retroviral ou non, peut dormer lieu a la 
production de motifs nucleiques ou proteiques qui pourraient soit proteger, soit 
declencher, ou favoriser ou aggraver une pathologic De meme, une structure retro- 

15 virale contenant des elements retroviraux endogenes selon 1' invention seraient a meme 
de provoquer un processus pathologique apres passage par un cycle transitoire 
exogene puis reintegration dans une region sensible ou critique du genome humain. 

On peut ainsi obtenir des profils d ? expression (transcrits et even- 
tuellement proteines) qui correspondent aux neuropathologies precitees. 

20 De meme, la combinaison de motifs appartenant a la famille de 

HERV-7q, ou d' elements induits par des motifs appartenant a la famille de HERV-7q, 
avec des motifs d'origine ou induits de maniere exogene seraient a meme de pouvoir 
declencher, ou aggraver un processus pathologique ou au contraire de favoriser une 
protection ou une remission partielle ou une guerison totale et definitive. 

25 La detection rendue possible des domaines de type HERV-7q, 

suggere des applications possibles a la fois au niveau prophylactique, du pronostic et 
du diagnostic : par exemple des approches immunologiques ou d'amplification 
genique permettant de comparer des individus normaux servant de reference avec des 
patients, seraient a meme de favoriser le depistage, d'ameliorer la detection precoce de 

30 la declaration de la maladie et/ou de suivre 1'evolution d'une pathologie chez des 
patients pouvant presenter une susceptibilite ou ayant declare la maladie ou encore 
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chez des individus consideres comme normaux, selon les criteres cliniques actuels. 

Les sondes nucleiques et immunologiques specifiques, telles que 
definies, dans la presente invention sont a meme de favoriser V identification et la 
detection de motifs anormalement exprimes dans le cadre de pathologies associees au 
5 cancer, ou de neuropathologies en particulier auto-immunes, au premier rang 
desquelles la sclerose en plaques. 

La presente invention a egalement pour objet des sequences 
nucleiques hybrides, caracterisees en ce qu'elles comprennent des sequences ou motifs 
appartenant a la famille de HERV-7q, ou d' elements induits par des motifs apparte- 
10 nant a la famille de HERV-7q, avec des motifs d'origine ou induits de maniere 
exogene (sequences retrovirales exogenes) ; de telles sequences hybrides sont vrai- 
semblablement a meme de pouvoir declencher, ou aggraver un processus pathologique 
ou au contraire de favoriser une protection ou une remission partielle ou une guerison 
to tale et definitive. 

15 La presente invention a egalement pour objet un reactif de diagnostic 

pour la detection differentielle de sequences nucleiques endogenes humaines 
completes ou partielles, presentant des motifs retroviraux, selectionnes parmi les 
sequences SEQ ID NO :1 et/ou SEQ ID NO :2, caracterise en ce qu'il est selectionne 
dans le groupe constitue par les sequences SEQ ID NO: 1-22, 28, 37-57, 59-61 et 121- 

20 122, les sequences nucleiques complementaires et les sequences inverses comple- 
mentaires des sequences precedentes, par les fragments nucleotidiques capables de 
definir ou d'identifier les sequences SEQ ID NO:l et/ou SEQ ID NO:2 et toute 
sequence flanquante ou les chevauchant ainsi que par les fragments issus des regions 
codantes des sequences SEQ ID NO: 1-22 et 61, correspondant a un cadre glissant 

25 superieur ou egal a 14 nucleotides ou leurs sequences complementaires, eventuelle- 
ment marquees avec un marqueur approprie ainsi que par les sequences telles que 
definies aux figures 18-21. 

Les sequences des sondes nucleiques, ribonucleiques et oligo- 
nucleotidiques utilisees seront choisies dans les regions env et gag ou leur regions 

30 flanquantes : par exemple les oligonucleotides amorces pour HERV-7q, seront choisis 
dans les regions situees entre les nucleotides 3065 et 4390, les nucleotides 6965 et 
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9550 ou les nucleotides 2502-2865 de la SEQ ID NO:3, ainsi que dans toute sequence 
adjacente (amont ou aval) capable de permettre une amplification specifique (figure 

1). 

Parmi les marqueurs appropries, on peut citer, les isotopes radio- 
5 actifs, les enzymes, les fluorochromes, des marqueurs chimiques (biotine), les 
haptenes (digoxygenine) et les anticorps ou analogues de bases appropriees. 
De maniere preferee : 

- ledit reactif est selectionne parmi les sequences SEQ ID NO: 3 7-5 7 
et est apte a etre utilise comme amorce. 
10 - ledit reactif est selectionne parmi les sequences suivantes : 

un fragment de 1505 nt amplifie par le couple d f amorces SEQ 
ID NO:37 et SEQ ID NO:38 (amorces GIF et G1R), 

un fragment de 2529 nt amplifie par le couple d' amorces SEQ 
ID NO:45 et SEQ ID NO:46 (amorces E1F et E1R), 
15 un fragment de 182 nucleotides repete deux fois, situe en amont 

du domaine gag aux positions 2502-261 1/2613-2865, 

des fragments codants ou non-codants pour tout ou partie de 
Fenverine, comprenant au moins 14 nucleotides et notamment les fragments codant 
pour la partie C-terminale de Fenverine, soit a partir de Facide amine 291, soit a partir 
20 de Facide amine 321, a compter de la premiere methionine, 

et est apte a etre utilise comme sonde. 

La presente invention a egalement pour objet un procede de detec- 
tion rapide et differential des sequences nucleiques retrovirales endogenes de type env 
ou env et gag, de leurs variants normaux ou pathologiques, par hybridation et/ou 
25 amplification genique, realise a partir d'un echantillon biologique, lequel procede est 
caracterise en ce qu'il comprend : 

(a) une etape dans laquelle Fon met en contact un echantillon biolo- 
gique a analyser avec au moins une sonde telle que definie ci-dessus et 

(b) une etape dans laquelle on detecte par tout moyen approprie, le 
30 ou les produits resultant de Finteraction sequence nucleotidique-sonde. 

Conformement audit procede, il peut comprendre : 
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* prealablement a l'etape (a) : 

. une etape de preparation du tissu ou du liquide biologique 

concerne, 

. une etape d'extraction de Tacide nucleique a detecter, et 
5 . au moins un cycle d' amplification genique et 

* posterieurement a l'etape (b) : 

. une etape de comparaison des sequences nucleiques obtenues dans 
ledit echantillon biologique avec les sequences retrovirales endogenes humaines selon 
I' invention par tout moyen approprie et notamment par sequen9age. Southern-blot, 
10 coupure de restriction, SSCP ou toute autre methode permettant d'identifier une inser- 
tion ou une deletion ou encore une simple mutation entre les differentes sequences 
comparees. 

Conformement a 1' invention, les sequences retrovirales endogenes 

humaines selon 1' invention sont ainsi comparees aux sequences nucleiques presentes 
15 dans l'echantillon biologique a analyser et permettent la detection de sequences 

homologues de patients atteints de pathologies, susceptibles de mettre en jeu une 

modification de leur genome. 

De maniere avantageuse, lesdites comparaisons geniques sont 

menees a partir d'ADN genomique provenant d'individus temoins et de patients. 
20 Une amplification genique classique par PCR sera menee a Taide 

d'amorces 5' -sens et 3' -antisens encadrant ou comprenant la zone a etudier (zone env 

ou zone gag). 

Egalement de maniere avantageuse, les sequences des sondes 
nucleiques, ribonucleiques et oligonucleotidiques utilisees sont choisies dans les 

25 regions env et gag ou leurs regions flanquantes : par exemple les oligonucleotides 
amorces pour HERV-7q, seront choisis dans les regions situees entre les nucleotides 
3065 et 4390 et les nucleotides 6965 et 9550, ainsi que dans toute sequence adjacente 
(amont ou aval) capable de permettre une amplification specifique (figure 1), comme 
precise ci-dessus. Elles sont de preference selectionnees dans le groupe constitue par 

30 un fragment de 1505 nt amplifie par le couple d'amorces SEQ 

ID NO:37 et SEQ ID NO:38 (amorces GIF et G1R), 
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un fragment de 2529 nt amplifie par le couple d' amorces SEQ 
ID NO:45 et SEQ ID NO:46 (amorces E1F et E1R). 

L'etape d' amplification genique est notamment realisee a Faide 
d'une des techniques d' amplification genique suivante : amplification par la Qp- 
5 replicase, PCR, LCR, ERA, CPR ou SDA. 

La presente invention a egalement pour objet des sequences 
chimeres, caracterisees en ce qu'elles sont constituees par un fragment de 17 a 40 
nucleotides d'une sequence flanquante telle que definie ci-dessus associee a un motif 
retroviral endogene de type HERV-7q comprenant entre 17 et 40 nucleotides, tel que 
10 defini ci-dessus. 

La presente invention a egalement pour objet un procedc de detec- 
tion des transcrits, tels que definis ci-dessus, caracterise en ce qu'il comprend : 

- le prelevement des ARN messagers provenant d'echantillons 
biologiques (tissus, cellules, fluides biologiques) temoins et d'un echantillon analogue 

1 5 preleve chez des patients et 

- T analyse qualitative et/ou quantitative desdits ARNm, par hybri- 
dation in situ, par dot-blot, Northern-blot, RNAse mapping ou RT-PCR, a l'aide d'un 
reactif de diagnostic tel que defini ci-dessus. 

La presente invention a egalement pour objet une methode de detec- 
20 tion et/ou devaluation d'une sur-expression/sous-expression ou d'une modification 
d'au moins l'une des sequences ou fragments de sequences retrovirales endogenes de 
type HERV-7q et/ou de leurs sequences flanquantes associees, caracterisee en ce 
qu'elle comprend : 

- le depot sur un support approprie comme par exemple un filtre de 
25 nylon, une lame de verre ou leur equivalent, de l'ADNc ou son equivalent provenant 

de clones, de produits de PCR obtenus a partir d' ADN genomique, de produits de RT- 
PCR provenant de transcrits ou encore de sequences oligonucieotidiques specifiques, 
lesdites sequences d'ADN etant des sequences ou des fragments de sequences retro- 
virales endogenes de type HERV-7q et/ou leurs sequences flanquantes, telles que 
30 definies ci-dessus, constituees par les transcrits et ADNc des sequences genomiques, 
qui codent pour tout ou partie d'un facteur, dont la fonction, la regulation/deregulation 
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ou Talteration est associee a 1' expression normale ou pathologique ou a la regula- 
tion/deregulation de motifs appartenant a ladite famille HERV-7q, ces sequences 
correspondant a des sequences nucleotidiques codant pour des genes situes dans des 
regions flanquantes situees en amont et/ou en aval d'une sequence retro virale de ladite 
5 famille HERV-7q et dont Tune des extremites ne peut se trouver a une distance 
excedant 120 kb, et/ou une sequence chimere telle que defmie ci-dessus. 

- F hybridation dudit support avec au moins une sonde marquee de 
maniere adequate obtenue, par exemple, par retrotransposition d'un melange d'ARN 
provenant de cellules, de tissus ou de liquides biologiques provenant de temoins 

1 0 reputes normaux, de membres de populations ethniques differentes, de patients atteints 
de pathologies souvent associees a une expression de retrovirus, comme les processus 
tumoraux, ou comme les maladies auto-immunes, et 

- la detection des hy brides formes. 

Selon un mode de mise en oeuvre avantageux de ladite methode, 
15 ledit transcrit ou ADNc est selectionne dans le groupe constitue par les sequences 
SEQ ID NO:62-67 et 119 et leurs fragments correspondant a un cadre glissant supe- 
rieur ou egal a 14 nucleotides ou leurs sequences complementaires. 

Selon un autre mode de mise en oeuvre avantageux de ladite 
methode, ledit support comprend en outre toute sequence retrovirale endogene ou 
20 exogene. 

La methode des puces a ADN (Bowtell, (1999), Nature Genet., 21, 
25- 32), est utilisee pour evaluer la modification de V expression de tout ou partie de 
certaines des sequences d'origine retrovirale de type HERV-7q et des sequences 
flanquantes. Brievement de 1' ADN provenant de clones, de produits de PCR obtenus a 

25 partir d' ADN genomique, de produits de RT-PCR provenant de transcrits ou encore de 
sequences oligonucleotidiques specifiques, sont deposees sur un support, comme par 
exemple un filtre de nylon, une lame de verre ou leur equivalent. Les sequences 
nucleiques deposees couvrent les differents domaines retroviraux decrits ci-dessus, 
ainsi que les sequences contigues et les genes flanquants. Afin de detecter d'eventuels 

30 processus d'epissage alternatifs, des ADN specifiques sont synthetises par pas de 500- 
600 nucleotides avec un chevauchement de 250- 300 nucleotides de part et d' autre. 
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Les epissages alternatifs deja identifies feront l'objet d'une synthese specifique. 
L'hybridation s'effectue a 1'aide d'une sonde obtenue, par exemple, par retrotranspo- 
sition d'un melange d' ARN provenant de cellules, de tissus ou de liquides biologiques 
provenant de temoins reputes normaux, de membres de populations ethniques diffe- 
5 rentes, de patients atteints de pathologies souvent associees a une expression de retro- 
virus, comme les processus tumoraux, ou comme les maladies auto-immunes, dont la 
sclerose en plaques. Dans ce cas une fraction de j^g et jusqu'a quelques jag d'ARNm 
ou jusqu'a quelques |^g ou dizaines de |j.g d'ARN, selon la methode utilisee et la taille 
de la puce d'ADN concernee, sont suffisants pour la synthese de la sonde nucleique. 

10 La sonde nucleique est marquee de maniere adequate, afin d'autoriser une detection 
ulterieure, comme par exemple par fluorescence ou par une methode equivalents 

L'usage de sondes bi-, voire multicolores permet de preciser 
1' expression concertee de plusieurs genes en parallele, en beneficiant de plus d'une 
normalisation precise. L' acquisition des resultats est effectuee automatiquement, 

1 5 comme par exemple par un sy steme de balayage laser ou son equivalent. 

Deux types de puces a ADN sont con<?ues, d'une part des puces 
presentant un ensemble exhaustif de sequences, et d' autre part des puces a ADN speci- 
fiques permettant un ciblage sur une application plus specifique. 

Par exemple, une sequence critique en ce qu'elle contiendrait une 

20 difference portant sur une deletion, voire une mutation, est detectee a l'aide 
d'oligonucleotides specifiques (Wang et coll., (1998), Science, 280, 1077- 1082). Le 
polymorphisme associe a une base ou a une mutation est detecte a l'aide de quatre 
oligonucleotides possedant une des quatre possibilites de sequence au niveau d'une 
base (A, C G ou T): pour chaque difference ponctuelle les 4 oligonucleotides sont 

25 deposes et les intensites d'hybridation sont comparees. De plus, un epissage alternatif 
est detecte en utilisant des ADN correspondant a un seul exon effectif ou putatif : le 
gene est done analyse exon par exon. Les puces a ADN concernent aussi, par exten- 
sion, toute sequence retrovirale endogene ou exogene, comme par exemple ERV-9, 
ERV-K, ERV-L, ERV-H, ERV-4, ERV-6, ERV-8, ERV-10, ERV-15, ERV-16, ERV- 

30 17, ERV-18, ERV-21, ERV-24, ERV-33, ERV-34, ERV-36, ERV-40, ERV-42, ERV- 
MLN, ERV-FRD, ERV-FTD...), ainsi que toutes les sequences exoniques putatives 
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(identifiees par 1' existence de sequences etiquettes et des transcrits correspondants) ou 
effectives, et qui sont situees de part et d'autre jusqu'a une distance de 120 kb des 
sequences retrovirales endogenes de type HERV-7q. 

L'etude comparative est menee entre un echantillon temoin et 
5 l'echantillon a tester, dans une perspective prophylactique, diagnostique ou therapeu- 
tique, comme par exemple: la detection precoce d'une modification de l'expression 
d'une des sequences, dans une cellule, un tissu ou un organisme, 1' identification d'une 
sequence associee a une susceptibilite ou a une pathologie quelconque, le suivi de 
revolution de la pathologie, ou encore le suivi d'un traitement et V evaluation de son 
10 efficacite. 

En dehors des applications deja enoncees, Finteret de la methode 
permet, d'une maniere plus generate, de faire un bilan des variations constatees chez 
un individu, ce qui constitue en quelque sorte une carte d'identite, ce qui facilite une 
approche epidemiologique permettant d'etablir de nouvelles correlations entre un 
1 5 profil particulier observe et une pathologie, en dehors de tout a priori concernant cette 
pathologie. 

La presente invention a egalement pour objet un kit de detection 
et/ou d' evaluation d'une maladie auto-immune et notamment des neuropathologies a 
etiologie auto-immune, caracterise en ce qu'il comprend outre les tampons necessaires 
20 a la mise en oeuvre des procedes tels que definis ci-dessus : 

- des reactifs A de diagnostic tels que definis ci-dessus, et 

- des reactifs B constitues par les transcrits et ADNc des sequences 
genomiques, qui codent pour tout ou partie d'un facteur, dont la fonction, la regula- 
tion/deregulation ou l'alteration est associee a l'expression normale ou pathologique 

25 ou a la regulation/deregulation de motifs appartenant a ladite famille HERV-7q, ces 
sequences correspondant a des sequences nucleotidiques codant pour des genes situes 
dans des regions flanquantes situees en amont et/ou en aval d'une sequence retrovirale 
de ladite famille HERV-7q dont l'une des extremites ne peut se trouver a une distance 
excedant 120 kb, 

30 lesquels reactifs sont de preference fixes sur un support approprie. 

Selon un mode de realisation avantageux dudit kit, lesdits reactifs B 
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sont selectionnes dans le groupe constitue par les sequences SEQ ID NO:62-67 et 1 19 
et leurs fragments correspondant a un cadre glissant superieur ou egal a 14 nucleotides 
ou leurs sequences complementaires, ainsi que les sequences representees aux figures 
13-17, 22-26. 

5 La presente invention a egalement pour objet des produits de traduc- 

tion, caracterises en ce qu'ils sont codes par une sequence nucleotidique telle que 
definie ci-dessus. 

La presente invention a egalement pour objet un peptide, caracterise 
en ce qu'il est susceptible d'etre exprime a l'aide d'une sequence nucleotidique selec- 

10 tionnee dans le groupe constitue par les sequences SEQ ID NO: 1-22, 28 et 61, telles 
que definies ci-dessus, selon les combinaisons offertes par T usage des differents 
cadres de lecture possibles (voir egalement figures 18-21). 

Ledit peptide englobe egalement les peptides ou polypeptides deri- 
ves comprenant entre 5 et 540 aminoacides (SEQ ID NO:23-36 et SEQ ID NO:58 et 

15 leurs fragments d'au moins 5 aminoacides) et notamment un fragment de 538 amino- 
acides, commen9ant a la premiere methionine de la sequence SEQ ID NO:26 (enve- 
rine). 

Selon un mode de realisation avantageux desdits peptides, ils sont 
notamment selectionnes parmi les sequences SEQ ID NO:23-36, 58, notamment la 
20 sequence SEQ ID NO:26 et ses fragments C-terminaux, soit a partir de Tacide amine 
291, soit a partir de Tacide amine 321, a compter de la premiere methionine. 

Selon un autre mode de realisation avantageux desdits peptides, ils 
sont obtenus a partir des sequences nucleiques telles que definies ci-dessus, dans 
lesquelles au moins un codon non-sens peut etre remplace par un codon codant pour 
25 run des aminoacides suivants : Phe (F), Leu (L), Ser (S), Tyr (Y), Cys (C), Trp (W), 
Gin (Q), Arg (R), Lys (K), Glu (E) ou Gly (G). 

L' invention englobe ainsi les peptides deduits ou les proteines 
deduites correspondant a tout ou partie des sequences nucleiques decrites dans 
1' invention, et presentant eventuellement des modifications avec les sequences de refe- 
30 rences decrites dans l'invention, lorsqu'ils sont exprimes chez certains patients. En 
particulier, T invention englobe les sequences completes ou partielles obtenues selon 
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les 3 cadres de lecture sens et les 3 cadres de lecture inverses et complementaires. 
(voir figures 18-21) 

De maniere avantageuse, 1' analyse de la structure du domaine env de 
HERV-7q, appele enverine, a permis de mettre successivement en evidence: 
5 - un peptide signal N-terminal (region 1- 21) et deux domaines 

transmembranaires (region 320-340; 455-477), responsables d' interactions avec des 
motifs proteiques ou lipidiques membranaires, 

- un motif immunomodulateur de type CKS-17(Haraguchi et coll., 
(1995), 92, 5568- 5571)/ CKS-25. On peut noter a cet egard, la presence d'un motif 

10 RalD a i'interieur du peptide de type CKS-17/CKS-25 de HERV-7q et un motif RvaD 
en position 363 qui correspondent au consensus W/RxxD, propose pour le site actif 
des TGF-p (Huang et al., J. Biol. Chem., 1997, 272, 27155- 27159), de puissants 
facteurs associes a la croissance, a la differenciation et a la morphogenese et qui sont 
associes a de nombreuses pathologies humaines, comme les processus tumoraux 

15 (Tang et coll., (1998), Nat. Med., 4, 802- 807) ou les maladies neurodegeneratives 
(Flanders et coll., (1998), Prog. Neurobiol., 54, 71- 85). Les peptides selon r invention 
contenant ces motifs peuvent avantageusement servir d'antagonistes en inhibant la 
fixation des TGF- p sur leurs recepteurs naturels. 

- des motifs de N-glycosylation. La glycosylation des proteines 
20 d'enveloppe des retrovirus semble etre directement associee a leurs proprietes fonc- 

tionnelles, par exemple en influen^ant le nombre des determinants disponibles dans les 
cellules-T ou en favorisant la reconnaissance des antigenes par les cellules-T. La 
glycosylation pourrait jouer un role dans la declaration ou l'extension d'une patholo- 
gie a incidence autoimmune. Les glycosylations sont necessaires au maintien de la 
25 conformation de certains epitopes, en particulier lors de la realisation d'une proteine 
d'enveloppe recombinante a fin de mise au point d'un reactif de diagnostic et pour 
favoriser Fefficacite d'un eventuel vaccin. Positions 171, 210, 216, 236, 244, 283 et 
411. Nombre prevu au hasard : 3.2 

- des sites de prenvlation . La prenylation est un mecanisme essentiel 
30 de la fixation a la membrane cellulaire et pour le ciblage de certaines proteines. Ce 

processus de ciblage pourrait etre essentiel pour V elaboration d' agents therapeutiques 
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specifiques aptes a interferer dans la realisation et la regulation du trafic de complexes 
cellulaires mettant en jeu des proteines impliquees dans les interactions, la croissance 
et les mouvements cellulaires. Positions 188 et 290. Nombre prevu au hasard : 1.8 

- des sites de ciblage dans le reticulum endoplasmique . Ces sites 
5 permettraient d' assurer le ciblage vers le reticulum endoplasmique afm d'effectuer les 
modifications necessaires pour favoriser le franchissement membranaire. Positions 
353 et 43 1 . Nombre prevu au hasard : 0.2. 

Par ailleurs, les Inventeurs ont montre qu'un certain nombre de 
peptides issus de la proteine env de HERV-7q (enverine) presentent une affinite/demi- 
10 vie elevees pour des alleles HLA de classe I. Une analyse par CADD a permis de 
selectionner des peptides candidats, dont les meilleurs scores sont indiques dans le 
Tableau I: 

TABLEAU I 
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1144 


SEQ 


ID 


NO: 


109 


488 


EPKMQSKTKI 


B-5101 


968 


SEQ 


ID 


NO: 


110 


3 


LPYHIFLFTV 


B-5101 


629 


SEQ 


ID 


NO: 


111 


125 


REKHVKEVI 


Kk 


1000 


SEQ 


ID 


NO: 


112 


312 


KPRNKRVPIL 


B7 


800 


SEQ 


ID 


NO: 


113 


378 


WLQNRRAL 


Db 


792 


SEQ 


ID 


NO: 


114 


377 


AWLQNRRAL 


Db 


660 


SEQ 


ID 


NO: 


115 


321 


LPFVIGAGV 


B-5101 


629 


SEQ 


ID 


NO: 


116 


304 


DLYSYVISK 


A3 


540 


SEQ 


ID 


NO: 


117 


301 


TEQDLYSYVI 


Kk 


500 


SEQ 


ID 


NO: 


118 



Ce Tableau I indique une estimation de la demi-vie de dissociation 
35 d'un peptide de Tenverine avec un allele du systeme HLA de classe I (les tables de 
coefficients de Parker: J. Immunol, (1994), 152, 163- 175). La localisation indique la 
position du premier acide amine des peptides testes dans la sequence de l'enverine. Le 
code a une lettre est utilise pour la sequence des acides amines. Les scores autour de 
500 ou superieurs a 500 ont ete retenus. A titre de comparaison, une analyse a ete 
40 effectuee sur une concatenation de peptides (polypeptide de 4968 acides amines) 
reputes pour fixer les molecules du complexe majeur d'histocompatibilite de classe 1 
(Rammensee, Immunogenetics, (1995), 41, 178- 228): les dix meilleurs scores enre- 
gistres pour des nonapeptides et le type HLA, A_0201 sont respectivement de 4984, 
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4047, 2406, 1267, 800, 705, 607, 591, 591 et 577. 

II ressort de ce Tableau I que certaines molecules du complexe 
majeur d'histocompatibilite de type I sont aptes a fixer des peptides issus de 
1'enverine, ainsi assimiles a des peptides d'origine virale ou tumoraie, au niveau du 
5 reticulum endoplasmique. Les complexes formes au niveau du reticulum endo- 
plasmique sont alors transposes a la surface cellulaire, ce qui entraine la destruction 
de la cellule cible par les lymphocytes-T cytotoxiques. Les peptides identifies 
comportent generalement 8 a 10 acides amines. Des etudes ont montre que certains 
alleles du systeme HLA de classe I sont ainsi associees a certaines pathologies, en 

10 particulier a caractere auto-immun, comme HLA-B27 avec la spondylarthrite ankylo- 
sante ou HLA-B5 1 avec la maladie de Behcet. 

Un peptide apte a fixer une molecule particuliere de classe I est par 
consequent apte a fonctionner comme un epitope de cellule-T. 

En consequence, la presente invention inclut egalement les 

15 fragments 399-471 et 244-271 de l'enverine qui regroupent avantageusement plusieurs 
epitopes de forte affinite pour differents haplotypes du systeme HLA de classe I. 
L'usage de tout ou partie de ces polypeptides est en consequence apte a favoriser une 
augmentation du repertoire des cellules-T, en permettant une meilleure efficacite de la 
reponse immunitaire dans le cadre des differentes strategies immunotherapeutiques, 

20 prophylactique ou vaccinales). Ces peptides pourront etre avantageusement delivres 
par exemple par l'usage, de vecteurs viraux, de particules virales ou synthetiques, de 
lipopeptides, d'adjuvants classiques, d'acides nucleiques nus ou adsorbes sur des 
particules, ou de liposomes, 

Au sens de la presente invention, les peptides peuvent etre chimi- 

25 quement ou biochimiquement modifies ; certaines des acides amines peuvent etre 
remplaces par un acide amine analogue, selon les criteres classiques d'homologies (A 
ou G ; S ou T ; I, L ou V ; F, Y ou W ; N ou Q ; D ou E). 

La presente invention a egalement pour objet des compositions 
immunogenes ou vaccinales, pour la protection contre les maladies auto-immunes, 

30 notamment chez les sujets a risque, caracterisee en ce qu'elle comprend au moins un 
peptide comprenant au moins un motif de type CKS et/ou au moins un peptide 
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constitue par un motif presentant une affinite avec Tun des haplotypes du systeme 
HLA de classe I ou de classe II et un vehicule pharmaceutiquement acceptable. 

Selon un mode de realisation avantageux de ladite composition, ledit 
motif est selectionne dans le groupe constitue par les peptides tels que definis dans le 
5 Tableau I ci-dessus. 

Selon un autre mode de realisation avantageux de ladite composi- 
tion, ledit peptide presente la sequence suivante : 

sequence CKH: LONRRALDLLTAERGGT clFLGEECCYYV 
(SEQ ID NO: 120). 

10 II est remarquable de constater au niveau de la position 380 de la 

proteine enverine, la contigui'te des motifs de type CKS-17 (souligne) et du peptide 
presentant le score le plus eleve (en gras ; voir peptide en position 399 dans le Tableau 
I, SEQ ID NO:68) dans la sequence CKH. 

L' activation clonale des sous-groupes de lymphocytes, par exemple 

15 de lymphocytes cytotoxiques, par les peptides du Tableau I et par extension leurs 
homologues, est bloquee par des manoeuvres usuelles d'immunotherapie comme par 
exemple la serotherapie et la vaccination. 

U association de deux sequences ou des sequences analogues au 
peptide CKH (SEQ ID NO: 120), est a meme d'entrainer un processus synergique dans 

20 la reponse immunitaire, qui pourrait mettre en jeu des voies de signalisation et 
d'activation complementaires, aptes a moduler 1' activation lymphocytaire. 

La vaccination concerne la production d'anticorps diriges contre les 
peptides du tableau I, selon les regies de Tart et selon les methodes de liberation 
controlees par implants artificiels ou cellulaires mettant en ceuvre une composition 

25 telle que definie ci-dessus et par usage des manoeuvres de therapie genique, comme 
par exemple par expression des sequences nucleiques codant pour les peptides du 
Tableau I. En consequence 1' invention a egalement pour objet des compositions 
immunogenes ou vaccinale caracterisee en ce qu'elles comprennent un vecteur 
incluant au moins une sequence nucleique codant un peptide tel que defini dans le 

30 Tableau I, eventuellement associee a une sequence codant un motif de type CKS-17. 

La serotherapie concerne 1' utilisation d'anticorps neutralisants 
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produits a partir des peptides du Tableau I et leurs homologues. 

Les produits proteiques generes par les sequences retrovirales endo- 
genes ou produits parallelement peuvent avantageusement etre caracterises par des 
micro-methodes d' analyse et de quantification des peptides et des proteines: 
5 HPLC/FPLC ou equivalent, electrophorese capillaire ou equivalent, techniques de 
microsequen9ages (methode d'Edman ou equivalent, spectrometrie de masse...). 

L' invention a egalement pour objet des anticorps diriges contre Tun 
ou plusieurs des peptides decrits ci-dessus et leur utilisation soit pour la mise en ceuvre 
d'une methode de detection in vitro, notamment differentielle de la presence d'une 
10 telle sequence chez un individu, soit pour la preparation d'une composition apte a etre 
utilisee en serotherapie dans les neuropathologies a composante auto-immune. 

Lesdits anticorps sont avantageusement des anticorps polyclonaux 
ou monoclonaux obtenus par une reaction immunologique d'un organisme humain, 
mammiferes, oiseaux ou autres especes vis-a-vis des proteines, telles que definies ci- 
1 5 dessus. 

La presente invention a pour objet un procede de depistage 
immunologique differentiel de sequences retrovirales endogenes humaines de la 
famille HERV-7q normales ou pathologiques, caracterise en ce qu'il comprend la mise 
en contact d'un echantillon biologique avec un anticorps selon l'invention, la lecture 
20 du resultat etant revelee par un moyen approprie, notamment EIA, ELISA, RIA, 
fluorescence. 

A titre d' illustration, une telle methode de diagnostic in vitro selon 
l'invention comprend la mise en contact d'un echantillon biologique preleve chez un 
patient, avec des anticorps selon l'invention et la detection a l'aide de tout procede 
25 approprie, notamment a l'aide d'anti-immunoglobulines marquee, des complexes 
immunologiques formes entre les proteines produites normalement ou pathologique- 
ment et les anticorps. 

Des anticorps monoclonaux ou polyclonaux, produits a partir 
d'antigenes correspondants a des peptides de synthese, de polypeptide ou proteines 
30 recombinants, permettent de suivre 1' expression des peptides ou proteines produits 
normalement ou pathologiquement. L' analyse est de preference effectuee par ELISA, 
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ou equivalent, Western-blot ou equivalent, ou par immunohistochimie. 

Les peptides ou proteines, issus des sequences retrovirales endo- 
genes ou dont 1' expression est associee a 1' expression de ces sequences retrovirales 
endogenes, sont recherches et identifies. 
5 La presente invention a egalement pour objet un procede ^identifi- 

cation et de detection de motifs retroviraux endogenes, anormalement exprimes dans 
le cadre de pathologies associees au cancer, ou de neuropathologies en particulier 
auto-immunes, au premier rang desquelles la sclerose en plaques, caracterise en ce 
qu'il comprend l'analyse comparee des sequences extraites d'un echantillon biologique 

10 avec les sequences selon l'invention. 

La presente invention a egalement pour objet l'application des 
sequences nucleiques ou des sequences proteiques selon l'invention au diagnostic, au 
pronostic, a 1' evaluation de la susceptibilite genetique, a toutes maladies humaines 
induites, innees ou acquises en particulier celles a composantes cancereuses, auto- 

15 immunes et/ou a incidence neurologique, comme la sclerose en plaques, les 
syndromes associes et les maladies neurodegeneratives ou intervient tout ou partie des 
sequences nucleiques selon l'invention et des formes endogenes ou exogenes appa- 
rentees. 

La presente invention a egalement pour objet des sequences 
20 nucleiques hybrides, caracterisees en ce qu'elles comprennent des sequences ou motifs 
nucleiques selon 1' invention, combines avec des sequences ou motifs d'origine endo- 
gene ou d'origine ou induits de maniere exogene. 

La presente invention a, en outre, pour objet un vecteur recombinant 
de clonage ou d' expression, caracterise en ce qu'il comprend une sequence nucleique 
25 conforme a l'invention. 

Des manoeuvres therapeutiques peuvent etre envisagees par usage de 
certaines des sequences nucleiques contenues dans HERV-7q et les sequences de la 
meme famille ou des structures polypeptidiques deduites ou par utilisation de peptides 
ou proteines, ou d'anticorps specifiques. 
30 Conformement a l'invention, tout ou partie des sequences nucleiques 

retrovirales endogenes de type HERV-7q, peut etre utilisee a usage de vecteur ou 
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d'elements de vecteurs a vocation therapeutique, en particulier les sequences LTR et la 

region gag (SEQ ID NO :2, 2 1 et 22). . 

L'interet de telles sequences reside, dans Tinnocuite du vecteur ainsi 

forme, dans la possibility d'une insertion specifique ciblee dans une region bien defi- 
5 nie par une strategic analogue a la recombinaison homologue, dans le ciblage cellu- 

laire, eventuellement transitoire dans le cas d'une expression placentaire chez la 

femme. Un autre aspect concerne la possibility d'associer aux genes d'interets les 

motifs retroviraux biologiquement actifs (peptides immunomodulateurs, tels que 

represents aux sequences SEQ ID NO 68-1 18, ci-apres, peptide fusogene...). 
10 La presente invention a egalement pour objet des animaux 

transgeniques, caracterises en ce qu'ils comprennent tout ou partie d'une sequence de 

type HERV-7q (SEQ ID NO: 1-22 et 61). 

Le Tableau II ci-apres etablit les correspondances entre les numeros 

des sequences telles qu'elles apparaissent dans la liste de sequences et le nom des 
15 differentes sequences. 

TABLEAU II 



SEQ ID NO : 


DESIGNATION 


1 


Acide nucleique 


7 env 


2 


Acide nucleique 


gag 


3 


Acide nucleique • 


HERV-7q 


4 


Acide nucleique 


HE2 


5 


Acide nucleique 


HE3 


6 


Acide nucleique 


HG3 


7 


Acide nucleique 


HE4 


8 


Acide nucleique 


HE5 


9 


Acide nucleique 


HE6 


10 


Acide nucleique 


HG6 


11 


Acide nucleique 


HE7 


12 


Acide nucleique 


HE8 


13 


Acide nucleique 


HG8 


14 


Acide nucleique 


:HE9 


15 


Acide nucleique 


:HE10 


16 


Acide nucleique 


: HE11 


17 


Acide nucleique 


:HG11 


18 


Acide nucleique 


: HE12 


19 


Acide nucleique 


: HG12 
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SEO ID NO 


DESIGNATION 


90 


Afirlp rniplpiniu 1 * T? 1 
/AvluC llLldClvj UL . JXI 


21 


Aridp nnrlpimip * R 1 F 

AwlUt IlUwXvxLjU.t, . XVI A 


22 


Aridp nnrlpiniip -4- nrr»tpinp pnv dpdnitp * FFFT\\/-7n 

lYL/XUt/ llUvlvlU Uv 1 LJi VJ IVwXXX^/ vli V UtUUl Lv^ . HijiV V / w| 


23 


Fraampnt Hp nrotpinp env deduite selon SFO TO NO '99 


24 


Fraament dp nroteine env deduite selon SFO TD NO *99 

J. 1 Clti lllt/l I L \X IJxVJtvlxHw wii V UvViUi Lv OV^lWll kJJ_>VJ^ IJ-y 1 " • ~ — 1 


25 


Fraompnt dp nrotpinp pnv deduite selon SFO TD NO *99 


26 


Prntpinp * pnvprinp 

1 lvjlvllit . vli V vl Xllv 


97 


Fr^crmpnt dp nrotpinp pnv dpdmtp splon SFO TO NO "99 

1 1 aUlUCllL UW LJI VJ lt/lllv vli V U^UUl Lw O v I Ull OJ-^VJJ 1X-X i^l V • — »-^- 


98 

ZrO 


Ar*idp nnrlpiniip -h nrotpinp dpdnitp dp cacr • l-rFI< , \/-7n 

xAvluG lluvlvlU LAC- 1 JJxVJLt'lllv U.^LXlXi Lt Uv ^ug, . X XX-/ XV V / v£ 


9Q 


X^uglllCIll U.C piULClilC uCuuILC DCIUll Oivy XjLV 1NW .Z.O 


30 


Frflampnt dp nrntpinp o~?*o~ dpdintp splon SFO TF) NO *9R 

X lubiillvXll VJ-C LJlvJlvIlXt/ £L,Cl£i Ut/U L±i JtlUU Oljy IX/ 1 > . — O 


31 


Fracrmpnt dp nroteine q&o deduite selon SFO TF) NO "98 


32 
«jz* 


Fragment de nroteine t?a2 deduite selon SFO ID NO "28 


.J -7 


Fracrment de nroteine deduite selon SFO ID NO *98 


34 


Fragment de nroteine 2ae deduite selon SEO ID NO *28 


35 


Protein e env * cadre de lecture 1 


36 


Proteine ffaff 


37 


Acide nucleinue * OIF famorcei 


38 


Acide nucleiaue * OIR (amorce^ 


39 


Acidp nnrlpinup * 09F Tamorce^ 

rivlviv liUvivlUUv ♦ V_J X— X 1 CXXXXV/X wvy 


40 

Til 


Acidp miclpinue * 02R Tamorcei 


41 


Acidp miclpinue * 04F famorce^l 


42 


Aridp nnclpinup * 03F famorce^ 

rVvlUv llUvivlU Uv • VJ Jl 1 CUllVJl vW 


43 


Apidp nnclpinup * 04R Tamorcp^ 

iXviUv uUvlvlUUv . VJ ~X V ^ClXlXVJlVvVvf 


44 


Acidp miclpinue * OSR Tamorcei 

AtlUL UUvlvlUUv • VJ w/ XV ^CtXXXvJX w y 


45 


Aridp nuplpiniip * F1F /^amorcp^ 

rxviUv iiUvivivjUv . 1—/ x x ^axxivJXvvy 


46 


Apidp niiplpinnp * F1R famorcp^ 

XV V/ iVXt/ XXlXwXwlVJ IXw . x_v 1 XV y^ClXXAVJl vVv J 


47 


Aridp miclpinue * F2F TamorcPi 


48 


Aridp mmlpinup * F9R Tamorce^ 

AvlUv UUV/lWlUUv • X_vZ*XV ^OlllVJi vv y 


49 


Aridp rmrlpimip * F3F ^amorrp^ 
rVviut xxiXvXwiLJLiw . i—> x ^aiiiwiuu j 


50 


Acide nucleiaue * F3R famorce^ 

n,vlUv HU.vXvi.Uviw • xjJlV ^CXXXXVJXvvy 


51 


Acide nucleiaue * F4F famorce^ 

L Ivl^Xv llVXvlvlu vi-v « rx i uiiiui v v / 


52 


Acide nucleiaue * F4R (amorce^ 

AtlUv UUvlvlUUv • XjTXV ^ttlllvJl vv i 


53 


Acide nucleiaue * F5F ^aniorce^ 

X W l\Xw UUvlvlUUv » X > ^ J \ Ulllvlvv / 


54 


Acide nucleiaue * F6F fajnorce^ 

livlVXV XXUvXvXUUv • XJVX 1 U111V1 V V / 


55 


Acide nucleiaue * E5R ( amorce » 

x IvlUv XXUvXVXUUv • X — ; ' X V I UX1XV71 vvy 


56 


Acide nucleique : ExF (amorce) 


57 


Acide nucleique : ExR (amorce) 


58 


Proteine gag 


59 


Acide nucleique : Sequence A (sequence d'insertion) 


60 


Acide nucleique : Sequence B (sequence d'insertion) 


61 


Acide nucleique : HE 13 


62 


Acide nucleique : RH7 
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SFO TH NO- 




TiFSTHNATTON 


UJ 


/AL-JLUC HUL/lClLj[U.C 


IVrVlvl / J 


OH- 


/\L/1U.C ilUClClvJUC 


P A V7 t 

Xv>rv V / J 


OD 


/\ciuc nucieicjue 


l\JDr J 


DO 


/\ciuc nucicique 


riiJ) 


£7 


/\ciue nucieicjue 


LI A 


Do 


r eptiue i aoieau j 




oy 


r epxiae i aoieau j 




/U 


r epiiae 1 aDieau J 




7 1 

/ 1 


Tl 4- ■■ ^-1 ' 1 Dill 1 

r cplluc 1 dDieau J 




77 


r epiiaC 1 dDlcdU 1 




7^ 


r epilQc 1 aDlcdU J 




7A 


r cpilCie 1 aDicdU i 




7^ 


T}(^r\ti r\ /=» Total i 1 
JTCpLlUC 1 aulCaU 1 




7£ 
/O 


± cpilUc 1 aulCaU J 




77 


L) /-J ' ! *o W 1 pail 1 

r cpiluc 1 dOlCdU J 




78 


icpilUC 1 aUlCau J 




70 

/ y 


Pp»T%f i Tdtalf^cin 1 
iCpilU-C 1 aUlCdU J 




RO 


x CpilCIC 1 aUlCclU J 




O 1 


T^£»r\"t*irl^ Total ill i 1 
1 CpilU-C 1 auicau. J 




8? 


T)^»r^ti rl /=» 'Totalf^OH 1 
1 CpilU-C 1 auicau 1 




8^ 

OJ 


T^*ar^1"i rl /=» Totaled!! 1 
r eptlCie 1 dUlCdll 1 




8<i 

OH* 


repilUC 1 aDICaU 1 




8S 
OJ 


TD ■« r\ c± To.tal<=»on 1 
JT cpilUe 1 dUlcaU 1 




8£ 


repiiue I dDlcdU 1 




87 


JrcpilUC 1 dDlcdU I 




QQ 
OO 


r epilQc 1 aDlcaU I 




8Q 


r cpiluc i aDlcaU I 




on 


i cpuuc I auicau 1 




Q1 


repilQe laDlCdU 1 




Q7 

yz. 


sr epilCLc 1 dulcdu 1 




yj 


r cpLlQc 1 aDlcaU 1 






IrcpilQc 1 dDlcdU 1 




yz> 


anti A TPo 1 poll 1 

Jrcptluc I aDlcdU 1 




OA 


A cpilU.C 1 dDlCdU 1 




07 
y i 


i cpiicic i auicau i 




OR 


x cptlUC 1 dDlCdU J 




99 


Pentide Tableau 1 




100 


Peptide Tableau 1 




101 


Peptide Tableau ] 




102 


Peptide Tableau 1 




103 


Peptide Tableau 1 




104 


Peptide Tableau 1 




105 


Peptide Tableau 1 
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106 


Pentide Tableau T 


SEO ID NO: 


DESIGNATION 


107 


PpntiHp T?iblp?in T 


108 


Ppntirlp Tahlpau T 


109 


Ppntidp Tahlpau T 


110 


Peritide Tableau T 


111 


PptyHHp Tablpau T 


112 


Pprvrifip Tablpfiu T 


113 

X X ~J 


Ppnfidp Tfiblpfiu T 


114 


Pptitirlp Tablpau T 


1 15 

X X ~s 


PpntiHp Tfiblp^ii T 


116 


Peptide Tableau I 


117 


Peptide Tableau I 


118 


Peptide Tableau I 


119 


Acide nucleique : BLIMP- 1 


120 


Peptide : CKH 


121 


Acide nucleique : F645 (amorce) 


122 


Acide nucleique : PS5D (amorce) 



Outre les dispositions qui precedent, 1' invention comprend encore 
d'autres dispositions, qui ressortiront de la description qui va suivre, qui se refere a 
des exemples de mise en oeuvre du procede objet de la presente invention ainsi qu'aux 
5 dessins annexes, dans lesquels : 

- Figure 1. Sequence nucleique humaine HERV-7q, dont l'analyse et 
le traitement permettent de caracteriser une nouvelle structure retrovirale endogene. 
Les regions nucleiques repetees de type Rl et R2 et les domaines gag, pol et env sont 
soulignes. Les domaine de type gag et env sont en italiques. La region homologue a 

10 une partie 3' non-codante de Rab7 est doublement soulignee. 

- Figure 2. Cartographie de la region retrovirale endogene humaine 
HERV-7q. La partie haute de la figure correspond a une region anonyme du genome 
humain situee sur le bras long du chromosome 7. On peut identifier les domaines 
repetes (1), gag (2), pol (3) et env (4) de HERV-7q. La region env C-terminale (4.3) se 

15 prolonge en amont en un long cadre de lecture ouvert (4.2). Le domaine 4.1, corres- 
pond a la region N-terminale du domaine env. 

- Figure 3. Comparaison des sequences nucleiques repetees situees 
aux bornes de HERV-7q. Les regions nucleiques repetees 5'(haut) et 3'(bas), sont 
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comparees et les bases identiques sont indiquees par deux points. 

- Figure 4. Sequence deduite presentant un cadre de lecture ouvert 
dans le domaine de type-env de HERV-7q selon la regie du plus long cadre de lecture 
ouvert. 

5 - Figure 5. Sequences autour du domaine CKS-17 identifies dans 

differents domaines env deduits de la famille de HERV-7q et comparaison avec des 
motifs CKS-17 de reference. 

1) HE2 - 2) HERV-7q - 3) N° d'acces a GenBank: M85205 - 4) 
HE7 - 5) HE9 - 6) CKS-17: le motif peptidique doue de proprietes immunomodula- 
10 trices est souligne - 7) gp20 de retrovirus de type-D (SRV-Pc). 

- Figure 6. Sequence deduite possible du domaine de type-gag iden- 
tifie dans HERV-7q etablie selon la regie du plus long cadre de lecture ouvert. X et / 
correspondent respectivement a un codon non-sens et a un decalage de cadre de 
lecture. La sequence soulignee correspond au debut du domaine pol. 

15 - Figure 7. Comparaison des regions nucleiques couvrant la region 

gag de HERV-7q (haut) et HERV-TcR (bas) et leurs regions flanquantes. Les bases 
identiques sont specifiees par deux points. 

- Figure 8. Exemple d'alignements nucleiques du domaine de type 
env de HERV-7q avec des domaines de type env similaires presents dans des 

20 sequences retrovirales endogenes humaines de la meme famille. Les codons non sens 
sont soulignes : 1) HERV-7q - 2) HE2 - 03) HE3 - 04) HE4. 

- Figure 9. Alignements nucleiques entre le domaine gag de HERV- 
7q et les domaines correspondants appartenant a la meme famille, Comparaison avec 
des fragments de domaines gag isoles d'agents retroviraux infectieux. Sequences 

25 d'origine retrovirale infectieuse: N° d'accession dans la banque de donnees EMBL : 
1 ) A60168 - 2) A60201 - 3) A60200 - 4) A60171. Sequences retrovirales endogenes 
humaines: 5) HERV-7q - 6) HG1 1 - 7) HG3. Les chiffres indiques dans les sequences 
endogenes, correspondent au nombre de nucleotides inseres afin d'optimiser 
Falignement avec les sequences de type gag identifies dans des retrovirus d'origine 

30 infectieuse. 

- Figure 10. Alignement d'un motif gag proteique deduit (haut) 
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appartenant a un retrovirus infectieux (N° cT accession EMBL : A60200) avec le motif 
gag proteique deduit (bas) identifie dans HERV-7q. Les codons non-sens sont en gras 
et soulignes. Les acides amines identiques sont specifies par 2 tirets. Un tiret indique 
une deletion ou un acide amine homologue. 
5 - Figure 11. Alignement d'un motif env (haut) appartenant a un 

retrovirus infectieux (N° d'accession EMBL : A60170) avec le motif env (bas) identi- 
fie dans HERV-7q. Les nucleotides homologues sont specifies par deux points et les 
deletions par un tiret. 

- Figure 12. Comparaison entre le domaine env de HERV-7q (haut) 
10 et le domaine env de HERV-9 (bas). L'homologie de 66 % se limite a la region 3 ? du 

domaine env de HERV-7q et HERV-9, respectivement entre les nucleotides 8976 nt et 
9500 nt de HERV-7q et les nucleotides 2898 nt et 3465 nt de HERV-9 (N° 
d'accession a GenBank : X57147). De nombreuses insertions/deletions sont aussi 
observees. 

15 - Figure 13. Homologie entre une partie de la sequence du transcrit 

codant pour RH7 (haut, SEQ ID NO:62) et un motif de RGH2 (bas - N° d'accession a 
GenBank: Dl 1018). 

- Figure 14. Identification de la sequence du transcrit codant pour 
RAM75 (SEQ ID NO:63), correspondant au gene d'une ATPase de type PEX1. Les 

20 exons codants sont soulignes. Les codons d'initiation et non-sens ainsi que les sites 
putatifs de polyadenylation sont en gras et soulignes. La region en italique correspond 
au debut de la sequence retro virale endogene RH7. 

- Figure 15. Sequence du transcrit codant pour RAV73 (SEQ ID 
NO:64) 5 situee a 0.7 kb en aval de HERV-7q ; les sequences nucleiques aptes a coder 

25 pour un ou plusieurs polypeptides sont soulignees. 

- Figure 16. Comparaison entre la sequence LTR 3' (haut) de 
HERV-7q et la sequence intronique LTX (SEQ ID NO:67), situee dans le gene FMR2, 
associe au X-fragile (bas). 

- Figure 17. Mise en evidence de modifications sur la sequence 
30 nucleotidique (ID NO:3), chez des patients atteints de SEP. Les bases modifiees, chez 

au moins un patient, sont soulignees. Les amorces utilisees sont en italiques 
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(sequences SEQ ID NO: 121 et 122). L'ATG d'initiation et le codon non-sens sont en 
gras. 

- Figure 18. Partie codante env de la sequence HERV-7q (sequence 
ID NO:3), avec 3 cadres de lecture. 

5 - Figures 19, 20, 21. Presentation separee de la proteine env selon les 

3 cadres de lecture. 

- Figure 22. Sequence nucleique contenant la sequence retrovirale 
RH7 situee en 5' de la sequence HERV-7q. La sequence en italique correspond au 
debut de la sequence HERV-7q. La sequence RH7 est soulignee. Deux sites de poly- 

1 0 adenylation putatifs sont gras. 

- Figure 23. Sequence du transcrit codant pour RBP3 contenant des 
motifs nucleotidiques identifies dans la sequence nucleique codant pour le gene 
Blimp- 1. 

- Figure 24. Sequence du transcrit codant pour APS. 

15 - Figure 25. Sequence du transcrit codant pour BIimp-1 ; la partie 

codante est soulignee ; les codons d'initiation et de terminaison sont en gras. 

- Figure 26. Sequence du transcrit codant pour FMR2. La partie 
codante est soulignee. Les codons d'initiation et non-sens sont en gras. 

II doit etre bien entendu, toutefois, que ces exemples sont donnes 
20 uniquement a titre d' illustration de l'objet de l'invention, dont ils ne constituent en 
aucune maniere une limitation. 

EXEMPLE 1 : Detection, par amplification genique, d'une sequence nucleique 
appartenant a un domaine de type gag ou env selon l'invention, dans un echan- 
tillon d'ADN genomique d'origine humaine ou de mammiferes. 

25 L' amplification genique s'effectue a partir d'ADN genomique isole 

a partir du sang. Un traitement anticoagulant est effectue avec 1 ml d'une solution de 
citrate (pour un litre : 4,8 g de d'acide citrique, 13,2 g de citrate de sodium, 14,7 g de 
glucose) pour 6 ml de sang frais. Apres centrifugation de 20 ml de sang pendant 15 
mn a 13.0000 g, le surnageant est elimine et la fraction enrichie en globules blancs est 
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transferee dans un nouveau tube, puis recentrifugee dans les memes conditions que 
precedemment La fraction enrichie en globules blancs est resuspendue dans un 
tampon d' extraction (10 nm Tris-HCl, 0,1 M EDTA, 20 |ug/ml de RNAse pancreatique 
traitee afm d'eliminer les DNAses, 0,5 % SDS, pH 8,0), puis incubee pendant 1 heure 
5 a 37°C. La proteinase K est ajoutee a une concentration finale de 100 |ag/ml. La 
suspension des cellules lysees est incubee a 50°C durant 3 heures sous agitation perio- 
dique, puis traitee par un volume egal de phenol equilibre par du Tris-HCl 0.5 M, pH 
8,0. L'emulsion formee est placee sur une roue pendant une heure, puis centrifugee a 
5000 g pendant 15 mn a temperature ambiante. La solution aqueuse est traitee depro- 

10 teinise par une triple extraction phenolique afin d'obtenir un niveau de purification 
correspondant a un rapport final d'absorbance A260/A280 superieur a 1.75. La frac- 
tion aqueuse est precipitee par 0,2 vol. d'acetate de sodium 10 M et 2 vol. d'ethanol. 
L'ADN est alors soit preleve avec l'extremite d'une pipette pasteur recourbee, soit 
centrifuge a 5000 g pendant 5 mn a temperature ambiante. L'ADN ou le culot d'ADN 

15 est lave deux fois par de Tethanol a 70 %, puis repris dans 1 ml de TE pH 8,0 afm 
d'etre elue sous agitation douce pendant 12 a 24 heures. 

Des oligonucleotides specifiques des sequences endogenes decrites 
selon Tinvention sont choisis pour amplifier la region gag ou env des regions retro- 
virales endogenes decrites selon Tinvention. L'ADN genomique etudie provient de 

20 patients presentant des pathologies comme la sclerose en plaques et d'individus repu- 
tes sains. 

Les ADN polymerases thermostables utilisees ont ete choisies pour 
leur grande fidelite lors du processus d' amplification, comme la Vent r ADN polyme- 
rase (Biolabs) ou equivalent, et sont utilisees selon les conditions preconisees par le 
25 fournisseur. 

La strategie d' amplification utilise selon les cas une simple PCR, ou 
une PCR nichee ou semi-nichee. 

Oligonucleotides utilises pour amplifier la region gag : 

- amorce GIF, sens, localisee dans la region amont du domaine gag 
30 de HERV-lq (SEQ ID NO:37), 

- amorce G1R, anti-sens, localisee dans la region 3' terminale du 
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domaine gag (SEQ ID NO:38), 

Le fragment de 1505 nt amplifie par le couple G1F-G1R : 1505 nt 
est utilise afin de generer les sondes aptes a hybrider les differents produits 
d'amplification des PCR. 
5 - amorce G2F, sens nichee (SEQ ID NO:39), 

- amorce G2R, anti-sens nichee (SEQ ID NO:40), 

- amorce G4F, sens nichee (SEQ ID NO:41), 

- amorce G3F, sens nichee (SEQ ID NO:42). 

- amorce G4R, anti-sens nichee (SEQ ID NO:43), 
1 0 - amorce GSR, anti-sens nichee (SEQ ID NO:44). 

Oligonucleotides utilises pour amplifier la region env de HERV-7q : 

- amorce E1F, sens (SEQ ID NO:45), 

- amorce E1R, anti-sens (SEQ ID NO:46), 

Le fragment de 2529 nt amplifie par le couple d'amorces E1F-E1R, 
15 est utilise afin de generer les sondes aptes a hybrider les differents produits 
d'amplification des PCR. 

- amorce E2F, sens (SEQ ID NO:47), 

- amorce E2R, antisens (SEQ ID NO:48), 

- amorce E3F, sens (SEQ ID NO:49), 

20 - amorce E3R, anti-sens (SEQ ID NO:50), 

- amorce E4F, sens (SEQ ID NO:51), 

- amorce E4R, anti-sens (SEQ ID NO:52), 

- amorce E5F, sens (SEQ ID NO:53), 

- amorce E6F, sens(SEQ ID NO:54) 
25 - amorce E5R(SEQ ID NO:55). 

- amorce ExF (SEQ ID NO:56) 

- amorce ExR (SEQ ID NO:57) 

La PCR est realisee a partir de 50 a 200 ng d'ADN genomique. Les 
conditions de PCR sont celles preconisees par le fournisseur. Les conditions cycliques 
30 d'amplification sont realisees dans 50 ul : une denaturation de 94°C pendant 1 min., 
une hybridation de 70°C pendant 1 min., et une elongation a 72 °C pendant 1 a 2 min., 
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selon les fragments amplifies. Apres 35 cycles, une reaction terminate est menee a 
72°C pendant 10 min. Le sequen£age automatique des echantillons amplifies est rea- 
lise a l'aide d'un sequenceur Applied Biosystems de type ABI 377 ou autre modele 
comparable, selon les protocoles fournis par le constructeur. 
5 Dans le cas d'une PCR nichee ou semi-nichee, les memes conditions 

experimentales sont utilisees, a la seule difference que f echantillon d"ADN geno- 
mique est remplace par 5 a 10 du produit d'amplification issu de la premiere PCR. 

Deux amplifications independantes sont realisees a partir du meme 
echantillon. Une reaction de controle est realisee en rempla9ant f echantillon d'ADN 
10 par de l'eau afin de detecter d'eventuels contaminants. 

EXEMPLE 2 : Detection par amplification genique d'une sequence nucleique 
selon ^invention dans un echantillon biologique d'ADN genomique preleve chez 
des patients presentant une pathologie candidate declaree ou la suspicion de cette 
pathologic 

15 Le protocole d ? amplification est le meme que dans l'exemple 1 ? mis 

a part forigine de l'echantillon qui provient de patients presentant une pathologie 
candidate. Un echantillon d'ADN genomique repute normal est systematiquement 
integre dans Tensemble des echantillons pathologiques amplifies puis analyses. 

Les produits de PCR sont separes sur un gel d'agarose a 1,5 %, puis 

20 transferes en presence de soude 0,4 N sur une membrane de nylon charge. Une hybri- 
dation est realisee avec une sonde specifique correspondant aux fragments de PCR 
amplifies soit par les couples G1F-G1R soit par le couple E1F-E1R. La sonde est 
marquee par incorporation de dUTP-digoxygenine selon le protocole du fournisseur 
(Boehringer Mannheim). L'hybridation est effectuee dans un tampon d'hybridation 

25 (5XSSC, 50 % formamide, 0,1 % lauroyl-sarcosine, 0,02 % SDS, 2 % de reactif de 
blocage Boehringer) pendant une nuit a 42°C. Le Southern est lave 2 fois 5 min. a 
temperature ambiante dans une solution de 2XSSC, 0,1% SDS. Puis un lavage a haute 
stringence est effectue a deux reprises pendant 15 min. a 55°C dans une solution 
0,1XSSC, 0,1 % SDS. L'hybridation est revelee selon le protocole du fournisseur 

30 (Boehringer Mannheim), en presence d'un substrat chimioluminescent de la phospha- 
tase alcaline, de type CSPD ou CDP-STAR. Le filtre est revele apres une exposition 
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de 1 5min. a 60 min. 

Une analyse par SSCP (" single strand conformation polymor- 
phism ") permet de detecter des modifications discretes de la sequence des fragments 
amplifies par PCR. La PCR est menee en presence de dCTP marques au P 32 . L'echan- 
5 tillon a analyser est denature a 95°C pendant 10 min., en presence de tampon de 
charge, puis immediatement charge sur un gel de poly aery lamide a 10%, contenant 
7.5% de glycerol. La migration s'effectue a 4°C a 8-10 W. Le gel est seche puis auto- 
radiographic. 

Les fragments de PCR susceptibles de presenter une alteration de 
10 leur sequence nucleotidique sont sequences selon l'exemple 1. 

Une hybridation a Faide d'un oligonucleotide specifique (17 mers a 
20 mers) correspondant a la region nucleotidique modifiee permet d' identifier les 
echantillons presentant une modification identique (methode ASO). Brievement le 
southern est hybride avec un oligonucleotide marque distalement soit au P 32 , soit en 
15 presence de digoxygenine (selon le protocole de Boehringer Mannheim) puis lave 
dans des conditions stringentes a 65%C dans une solution 6XSSC, 0.05% pyrophos- 
phate de sodium. 

Par exemple, un sequenfage nucleotidique automatique a ete realise 
sur six fragments de PCR, provenant de 5 patients atteints de SEP et un temoin repute 

20 normal, et qui ont ete amplifies a partir des amorces F645: 
CTTCAAACAACAACCAGGAGG (SEQ ID NO:121) (situee a 26 nucleotides en 
amont de la methionine d'initiation de Fenverine) et PS5D: 
TTGGGGAGGTTGGCCGACGA (SEQ ID NO:122) (situee a 6 nucleotides en aval 
du codon non-sens de Fenverine. Des modifications de la sequence de fenverine ont 

25 ete observes sur 1'ADN de certains des patients (figure 17). 

EXEMPLE 3 : Detection d'une proteine selon Pinvention dans un echantillon 
biologique. 

- Preparation d'une fraction proteique purifiee de liquide cephalo- 
rachidien de patients atteints de SEP 
30 Apres un traitement a 56°C pendant 30 min, et elimination des 

immunoglobulines sur une colonne de proteine G HiTrap (Pharmacia), l'equivalent de 
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10 ml de LCR est depose sur une colonne de DEAE Sepharose CL-6B (Pharmacia). 
L'elution est realisee en Tris-HCl 20 mM pH 8,8, et un gradient de 0 a 0,4 M de NaCl, 
puis la fraction est dialysee 2 fois contre du tampon phosphate-NaCI (PBS). Apres 
concentration sur Ultrafree-MC (Millipore), la fraction est deposee sur une colonne de 
5 Superose 12 (FPLC Pharmacia) et eluee en presence de PBS. Apres separation par 
electrophorese en gel de polyacrylamide-SDS, et electo-transfert sur une membrane 
d'Immobilon-P (Millipore), les bandes proteiques sont soumises a une hydrolyse 
trypsique menagee. 

- Analyse de la fraction proteique par spectrometrie de masse 
10 Les peptides digeres en presence de trypsine, sont analyses par la 

methode de MALDI-TOF, qui permet l'analyse de peptides presents en melange. 
(COTTRELL J.S., Pept. Res., 1997, 7, 115-124). Les peptides caracterises en fonction 
de leur masse sont compares aux proteines et aux proteines associees selon 
r invention. 

15 EXEMPLE 4 : Detection d'anticorps specifiques anti-domaine env de HERV-7q. 

L' identification d'un long cadre de lecture ouvert au sein de la 
sequence env de HERV-7q, a permis de determiner une sequence proteique deduite 
SEQ ID NO:22 et 35 et figures 18-20 d'une region dudit gene. 

Les sequences de proteines deduites des sequences ID NO:22, 35 et 
20 des figures 18-20 sont positionnees comme suit par rapport a la figure 1 ou a la 
sequence ID NO: 3 : 

SEQ ID NO:22 (cadre de lecture 1) et figure 19: debut de la 
sequence codante : position 7874, fin de la sequence codante l er codon non-sens 
(position 9493) 

25 SEQ ID NO:35 : debut de la sequence codante : position 7874, fin de 

la sequence codante l er codon non-sens (position 9493) (cadre de lecture 1) 

Figure 19 : debut de la sequence codante : position 6970, fin de la 
sequence codante P r codon non-sens (position 9493) (cadre de lecture 1) 

Figure 20 : debut de la sequence codante : position 6971, la fin du 
30 cadre de lecture est decalee selon le cas de 1, 2 ou 3 codons 

Figure 21 : debut de la sequence codante : position 6972, la fin du 
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cadre de lecture est decalee selon le cas de 1 , 2 ou 3 codons 

Differents peptides correspondant a tout ou partie des SEQ ID 
NO:22 (voir SEQ ID NO:23-27 et 35) ont ete synthetises par genie genetique afin de 
tester leur specificite antigenique vis-a-vis de sera ou de tissus de patients atteints de 
5 SEP, par exemple. Brievement, tout ou partie de la region env de HERV-7q est sous 
clonee dans les vecteurs pQE30, 31 et 32. Les vecteurs pQE3(X 31 et 32 contiennent 
en 5' du multi-site de clonage les sequences consensuelles pour la transcription (le 
promoteur fort du bacteriophage T5, 2 operateurs de l'operon lactose), la traduction 
(un site d'accrochage ribosomal synthetique). De meme, pQE30, 31 et 32 possedent en 

10 3', le terminateur de transcription du phage 1 ainsi qu'un codon "Stop" pour la traduc- 
tion. L'expression de la proteine s'effectue apres transformation dans E. coli Ml 5. Le 
plasmide pQE30, 31 et 32 possedent en amont du site de polyclonage la sequence 
codante pour une suite de 6 histidines presentant une affmite pour les ions nickel. Cet 
enchainement permet la purification de la proteine chimerique exprimee. par adsorp- 

15 tion sur une resine constitute d'un ligand chelatant, l'acide nitrilotriacetique (NT A), 
charge de 4 ions nickel (resine NI-NTA, Qiagen). 

La transformation s'effectue par electroporation ou traitement au 
chlorure de calcium. Par exemple, une colonie d'E. coli Ml 5 est incubee dans 100 ml 
de milieu LB contenant 250 \xg de kanamycine, sous agitation a 37°C jusqu'a 

20 Tobtention d'une DO 600 de 0,5. Apres une centrifugation de 5 minutes a 2000g a 4°C, 
le culot bacterien est repris dans 30 ml de solution TFB1 (100 mM de chlorure de 
rubinium, 50 mM de chlorure de manganese, 30 mM d'acetate de potassium, 10 mM 
CaC12, 15% glycerol, pH 5.8), a 4°C pendant 90 minutes. Apres une centrifugation de 
5 minutes a 2000g a 4°C, le culot bacterien est repris dans 4 ml de solution TFB2 (10 

25 mM de chlorure de rubidium, 10 mM de MOPS, 75 mM CaC12, 15% de glycerol , pH 
8). Les cellules peuvent etre gardees a -70°C par aliquot de 500 ml. 20 jul de la ligation 
et 125 |al de cellules competentes sont melanges et places dans la glace 20 minutes. 
Apres un choc thermique de 42°C pendant 90 secondes, les cellules sont agitees 90 
minutes a 37°C dans 500 ml de milieu Psi-broth (milieu LB complemente par 4 mM 

30 de MgS0 4 , lOmM de chlorure de potassium). Les cellules transformees sont etalees 
sur des boites LB-agar complementees par 25 \xg/ml de kanamycine, et 100p,g/ml 
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d'ampicilline, et les boites sont incubees une nuit a 37°C. 

Les clones potentiellement recombinants sont repiques de maniere 
ordonnee sur un filtre de nylon depose sur une boite LB-agar complementee par 25 
|ug/ml de kanamycine et 100 jag/ml d'ampicilline. Apres une nuit a 37°C. les clones 
5 recombinants sont reperes par hybridation de l'ADN plasmidique avec la sonde 
nucleotidique amplifiee par PCR avec le couple d'amorces selon SEQ ID NO:45 et 
SEQ ID NO:46. 

Une colonie independante, contenant l'insert, est inoculee a 20 ml de 
milieu LB complementee par 25 j-ig/ml de kanamycine et 100 |j,g/ml d'ampicilline. 

10 Apres une nuit a 37°C sous agitation, 500 ml de meme milieu sont incubes au 1/50° 
par cette preculture jusqu'a l'obtention d'une DO 600 de 0,8, puis 1 a 2 mM final d'IPTG 
est ajoute. Apres 5 heures, les cellules sont centrifugees 20 minutes a 4000 g. 

Une partie du culot cellulaire est repris dans 5 ml de tampon de 
sonication (50 mM de phosphate de sodium pH 7,8, 300 mM NaCl) puis place dans la 

15 glace. Apres une rapide sonication, les cellules sont centrifugees 20 minutes a 
10000 g. Une partie du culot cellulaire est repris dans 10 ml d'une solution 30 mM 
Tris/HCl-20% sucrose pH8. Les cellules sont incubees 5 a 10 minutes sous agitation, 
apres adjonction de 1 mM EDTA. Apres une centrifugation de 10 minutes a 8000 g a 
4°C, le culot est repris dans 10 ml de 5 mM de MgS04 glace. Apres 10 minutes dans 

20 la glace sous agitation, les cellules sont centrifugees 10 minutes a 8000 g a 4°C. 

Le culot est repris par 5 ml/g dans du tampon A (6 M GuHCl 
(chlorhydrate de guanidine), 0,1M phosphate de sodium, 0,0 1M Tris/HCl, pH 8), 1 
heure a temperature ambiante. Le lysat est centrifuge 15 minutes a 10000 g a 4°C, et le 
surnageant est complement^ par 8 ml de resine Ni-NTA, preequilibree dans du tampon 

25 A. Apres 45 minutes a temperature ambiante, la resine est coulee dans une colonne, 
lavee par 10 fois le volume de la colonne par du tampon A puis par 5 fois le volume 
da la colonne par du tampon B (8 M uree, 0,1 M phosphate de sodium, 0,01 M 
Tris/HCl, pH 8). La colonne est lave par du tampon C (8 M uree, 0,1M phosphate de 
sodium, 0,01 M Tris/HCl, pH 6,3) jusqu'a ce que TA280 soit inferieur a 0,01. La 

30 proteine recombinante est eluee par 10 a 20 ml de tampon D (8 M uree, 0,1 M 
phosphate de sodium, 0,01 M Tris/HCl, pH 5,9) puis par 10 a 20 ml de tampon E (8 M 
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uree, 0,1 M phosphate de sodium, 0,01 M Tris/HCl, pH 4,5), puis par 20 ml de tampon 
F (6 M HC1, 0,2 M acide acetique). Apres une analyse en SDS-PAGE. la ou les 
fractions purifiees contenant la proteine chimerique ont permis l'obtention d'anticorps 
chez le lapin. Les anticorps obtenus sont testes par Western-blot apres revelation par 
5 un anticorps secondaire couple a la phosphatase alcaline. 

Des anticorps sont obtenus de la meme maniere, a partir de peptides 
synthetises chimiquement selon la technique de Merrifield (G. Barany and B. 
Merrifield, 1980, dans The peptides, 2, 1-284, E. Gross et J. Meienhofer. Academic 
Press, New York). 

10 Les anticorps specifiques obtenus sont utilises a fin de detection de 

1' expression serique ou tissulaire de tout ou partie des sequences retro virales endo- 
genes selon l'invention, dans les cas normaux et pathologiques. 

Les proteines d'origine serique ou tissulaire, sont separees sur gel 
d'acrylamide-SDS puis transferees sur un filtre de nitrocellulose a l'aide d'un appareil 

15 Novablot 2117-2250 (LKB). Le transfer! est effectue sur une feuille de Hybond C- 
extra (Amersham) en utilisant un tampon CAPS 100 mM pH 11, methanol, eau 
(V/V/V: 1/1/8) contenant 1 mM de CaCl2- Apres un transfert de 1 heure a 0,8 

mA/cm 2 , la feuille est saturee une heure a temperature ambiante dans du PBS-0,5 % 
gelatine. La feuille est mise en presence de l'anticorps specifique a la concentration de 

20 1/1000 dans du PBS-0,25 % gelatine. Au bout de 2 heures, le filtre est lave 3 fois 15 
minutes dans du PBS-0,1 % de Tween-20, puis le filtre est incube 30 minutes en 
presence d'un anticorps secondaire couple a la phosphatase alcaline (Promega), dilue 
au 1/7500 dans du PBS-0,25% gelatine. Apres trois lavages dans du PBS-0,1 % de 
Tween-20, le filtre est equilibre dans un tampon (100 mM de Tris-HCl pH 9,5, 100 

25 mM de NaCl, 5 mM de MgCl2). La revelation est effectuee en presence de 45 f.il de 
NBT a 75 mg/ml et 35 \i\ de BCIP a 50 mg/ml, pour 10 ml de tampon de phosphatase 
alcaline. 

Les proteines chimeriques obtenues par genie genetique, sont utili- 
sees aussi a fin de tests d'activite biologique, comme par exemple pour le test 
30 d'activite biologique du peptide de type CKS-17 identifie dans le domaine env de 
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HERV-7q (figure 5). 

EXEMPLE 5 : Obtention de sondes ribonucleiques codant pour les sequences env 
de HERV-7q. 

Les fragments de PCR obtenus sont sous clones dans le plasmide 
5 PGEM 4Z (Promega) qui possede de par et d'autre de son site de polyclonage, les 
sequences promotrices pour les ARN polymerase SP6 et T7. 

La methode de competence utilisee est l'electroporation. Le plasmide 
et le fragment de PCR sont hybrides dans un rapport de 50 ng de vecteur (coupe a Sma 
I) pour 100 ng de fragment de PCR (rendu a bout franc par traitement par le fragment 

10 de Klenow de l'ADN polymerase). L'incubation a lieu une nuit a 22°C. dans le 
tampon de ligation (66 mM Tris-HCl pH 7,5, 5 mM MgC12, 1 mM dithioerythritol, 
1 mM ATP) en presence de lu. de T4 ADN ligase puis est arretee par denaturation 10 
minutes a 65°C. Parallelement, la souche d'E. Coli JM 105 est ensemencee une nuit a 
37°C dans du milieu LB. Cette preculture est diluee au 1/500 et placee a 37°C jusqu'a 

15 une DO 600 egale a 1. Pour la suite du mode operatoire les cellules seront toujours 
conservees au froid. Apres une centrifugation de 5 minutes a 3500 g a 4°C, le culot 
cellulaire est resuspendu dans 1/4 vol. d'eau glacee ultra-pure. Cette etape est repetee 5 
a 6 fois. Puis le culot est resuspendu dans 1/4000 vol. d'eau; 10 % de glycerol sterile 
sont ajoutes permettant la conservation des cellules electrocompetentes, par aliquots 

20 de 10 \xl a 20°C. A 50 jil de cellules electrocompetentes est ajoute 1 jllI de la ligation ; 
le tout est soumis a une decharge electrique de 12,5 kV/cm, appliquee pendant 5,8 ms. 
Les cellules sont rapidement remises en suspension dans le milieu SOC, incubees 1 
heure a 37°C, puis etalees, en presence de 2% X-Gal dans du dimethylformamide, et 
10 mM d'IPTG, sur une boite de gelose LB-agar supplementee en ampicilline (100 

25 fig/ml). Apres une nuit a 37°C, les clones blancs potentiellement recombinants, sont 
repiques de maniere ordonnee sur une boite LB/ampicilline et parallelement sur un 
filtre de nylon depose sur une boite LB/ampicilline. Ces deux boites sont incubees une 
nuit a 37°C. Les clones recombinants sont alors reperes par hybridation avec une 
sonde nucleique amplifiee par PCR avec le couple d' amorces selon SEQ ID NO:45 et 

30 SEQ ID NO:46 et marquee a la digoxygenine. 

Les clones recombinants sont cultives dans 50 ml de milieu 
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LB/ampicilline (100 jag/ml) en agitation pendant une nuit a 37°C. Apres une centrifu- 
gation a 3500 g pendant 15 minutes a 4°C, le culot bacterien est repris dans 4ml de 
tampon PI (50 mM Tris-HCl, lOmM EDTA, 400 |Lig/ml RNase A, pH 8) et 4ml de 
tampon P2 (200 mM NaOH, 1% SDS). Le melange est incube a temperature ambiante 
5 pendant 5 minutes. Apres adjonction de 4ml de tampon P3 (2.55 M d'acetate de potas- 
sium, pH 4,8) le melange est centrifuge a 12000 g pendant 30 minutes a 4°C. Le 
surnageant est applique sur une colonne Qiagen-type 100, preequilibree avec 2 ml de 
tampon QBT (750 mM NaCl, 50 mM MOPS, 15% ethanol, pH 7), la colonne est lavee 
avec 2 fois 4ml de tampon QC (1M NaCl, 50 mM MOPS, 15 % ethanol, pH 7) et 

10 l'ADN est elue avec 2ml de tampon QF (1,2 M NaCl, 50mM MOPS, 15 % ethanol, pH 
8). L'ADN est precipite avec 0,8 vol. d'isopropanol, et centrifuge a 12000 g a 4°C 
pendant 30 minutes. Le culot est lave avec de l'ethanol a 70 % glace, puis l'ADN 
plasmidique est repris par 2 fois 150 pi de tampon TE. 

Les sondes ribonucleiques sont utilisees comme sondes specifiques, 

15 en particulier pour la detection des transcrits exprimes par les sequences retrovirales 
endogenes selon Tinvention. 

EXEMPLE 6 : Construction d'une souris transgenique contenant tout ou partie 
du gene de Penverine. 

Une souris transgenique contenant tout ou partie de la sequence 
20 HERV-7q (SEQ ID NO:3) est construite afin d'identifier les sequences responsables 
de la specificite tissulaire, et pour evaluer le role de tout ou partie des motifs retro- 
viraux endogenes de type HERV-7q, en particulier tout ou partie des motifs pepti- 
diques de Tenverine. La technique de micro-injection utilisee se refere a la technique 
classique (Hogan et coll., (1994), Manipulating the mouse embryo, Cold Spring 
25 Harbor, Cold Spring Harbor Laboratory Press) ou a ses equivalents. Des formes iden- 
tiques a la molecule humaine normale de motifs de type HERV-7q, dont Tenverine, ou 
des formes mutees, deletees, presentant des insertions ou tronquees sont testees afin de 
determiner les motifs critiques tant sur le plan normal que pathologique, et plus parti- 
culierement au cours du developpement foetal et lors des processus tumoraux. 
30 Bibliographie : 

- Benit L. et aL, 1997. Cloning of a new murine endogenous retrovirus MuERV-L, with 
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strong similarity of the human HERV-L element and with a gag coding sequence closely 
related to the Fvl restriction gene. J. Virol. 71, 5652-5657. 

- Coffin J.M 1985. Endogenous retrovirus. In: " RNA tumor viruses '* (Weiss R.A., 
Varmus H.E., Teich N.M., and Coffin J.M. eds), Cold Spring Harbor Laboratory Press, 

5 Cold Spring Harbor, New York. 

- Conrad B., Weissmahr R.N., Boni J., Arcari R., Schupbach J., and Mach B. 1997. A 
human endogenous retroviral superantigen as candidate autoimmunogene in type 1 
diabetes. Cell 90, 303-313. 

- Covey S.N. 1986. Amino acid sequence homology in gag region of reverse transcribing 
10 elements and the coat protein gene of cauliflower mosaic virus. Nucleic Acids Res. 14, 

623-633. 

- Hertig C, Coupar B.E., Gould A.R., and Boyle D.B. 1997. Field and vaccine strains of 
fowlpox virus carry integrated sequences from the avian retrovirus, reticuloendotheliosis 
virus. Virology 235, 367-376. 

15 - Hohenadl C, Leib-Mosch C, Hehlemann R., and Erfle Y. 1996. Biological signifi- 
cance of human endogenous retroviral sequences. J. Acqui. Imm. Def. Synd. Hum. 
Retrovir. 13, S268-S273. 

- Kulkoski J.K., Jones S., Katz R.A., Mack J.P.G., and Skalka A.M. 1992. Residues 
critical for retroviral integrative recombination in a region that is highly conserved among 

20 retroviral/retrotransposon integrases and bacterial insertion sequence transposases. Mol. 
Cell Biol. 12, 2331-2338. 

-LaMantia G. et al,N.A.R., 1991, 19, 7, 1513-1520 

- Patience C, Wilkinson D.A., and Weiss R.A. 1997. Our retroviral heritage. Trends 
Genet. 13, 116-120. 

25 - Pearson W.R. 1994. Using the FASTA program to search protein and DNA sequence 
databases. Methods Mol. Biol. 24, 307-331. 

- Perron H., Garson J.A., Bedin F., Beseme F., Paranhos-Baccala G., Komurian-Pradel F., 
Mallet F., Tuke P.W., Voisset C, Blond J.L., Lalande B., Seigneurin J.M., Mandrand B. 
and the Collaborative Research Group on Multiple Sclerosis. 1997. Molecular identifica- 

30 tion of a novel retrovirus repeatedly isolated from patients with multiple sclerosis. Proc. 
Natl. Acad. Sci. USA 94, 7583-7588. 
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- Tonjes R.R. et al., J. AIDS and Hum. Retrovirol, 1996, 13, S261-S267 

- Vitelli R., Chiarillo M., Lattero D., Bruni C.B., and Bucci C. 1996. Molecular cloning 
and expression analysis of the human Rab7 GTP-ase complementary deoxyribonucleic 
acid. Biochem. Biophys. Res. Commun. 229, 887-890. 

5 - Weber L.T., Miller M., Jaskolski M., Leis J., Skalka M., and Wlodawer A. 1989. 
Molecular modeling of the HIV-1 protease and its substrate binding site. Science 243, 
928-931. 

- Wilkinson D., Mager D.L., and Leong J.A.C. 1994. Endogenous human retroviruses. In: 
" The Retroviridae " (Levy, J.A. ed), Plenum Press New York, , Vol. 3, 465-535. 

10 - Xiong Y., and Eickbush, T. 1990. Origin and evolution of retroelements based upon 

their reverse transcriptase sequences. EMBO J. 9, 3353-3362. 

Ainsi que cela ressort de ce qui precede, r invention ne se limite 

nullement a ceux de ses modes de mise en oeuvre, de realisation et d' application qui 

viennent d'etre decrits de fa?on plus explicite ; elle en embrasse au contraire toutes les 
15 variantes qui peuvent venir a 1' esprit du technicien en la matiere, sans s'ecarter du 

cadre, ni de la portee, de la presente invention. 
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REVENDICATIONS 

1°) Fragment d'acide nucleique purifie, caracterise en ce qu'il 
comprend tout ou partie d'une sequence codant pour une sequence retrovirale endo- 
gene humaine, qui presente au moins des motifs retroviraux de type env, repondant a 
5 la sequence SEQ ID NO:l ou a une sequence presentant un niveau d'homologie avec 
ladite sequence SEQ ID NO:l superieur ou egal a 80% sur plus de 190 nucleotides ou 
superieur ou egal a 70% sur plus de 600 nucleotides pour les domaines de type env. 

2°) Fragment d'acide nucleique selon la revendication L caracterise 
en ce qu'il presente a la fois de motifs retroviraux correspondant a un domaine env et 

10 repondant a la sequence SEQ ID NO:l et des motifs retroviraux correspondant a un 
domaine gag et repondant a la sequence SEQ ID NO: 2 ou a une sequence presentant 
un niveau d'homologie superieur ou egal a 80% sur plus de 190 nucleotides ou supe- 
rieur ou egal a 70% sur plus de 600 nucleotides pour les domaines de type env et un 
niveau d'homologie superieur ou egal a 90% sur plus de 700 nucleotides ou superieur 

15 ou egal a 70% sur plus de 1200 nucleotides pour les domaines de type gag, lesquels 
motifs ne presentent aucune insertion ou deletion superieure a 200 nucleotides. 

3°) Fragment d'acide nucleique, caracterise en ce qu'il comprend un 
segment d'une sequence selon la revendication 1 ou la revendication 2 et notamment 
les sequence SEQ ID NO:3-22, 28 et 61, les sequences nucleiques complementaires et 

20 les sequences inverses complementaires des sequences precedentes ainsi que les 
fragments issus des regions codantes des sequences precedentes correspondant a un 
cadre glissant superieur ou egal a 14 nucleotides ou leurs sequences complementaires. 

4°) Transcrits, caracterises en ce qu'ils sont generes a partir des 
sequences selon Tune quelconque des revendications 1 a 3. 

25 5°) Reactif de diagnostic pour la detection differentielle de 

sequences nucleiques endogenes humaines completes ou partielles, presentant des 
motifs retroviraux, selectionnes parmi les sequences SEQ ID NO:l et/ou SEQ ID 
NO:2, caracterise en ce qu'il est selectionne dans le groupe constitue par les sequences 
SEQ ID NO: 1-22, 28, 37-57, 59-61 et 121-122, les sequences nucleiques comple- 

30 mentaires et les sequences inverses complementaires des sequences precedentes, par 
les fragments nucleotidiques capables de definir ou d' identifier les sequences SEQ ID 
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NO:l et/ou SEQ ID NO:2 et toute sequence flanquante ou les chevauchant ainsi que 
par les fragments issus des regions codantes des sequences SEQ ID NO: 1-22 et 61, 
correspondant a un cadre glissant superieur ou egal a 14 nucleotides ou leurs 
sequences complementaires, eventuellement marquees avec un marqueur approprie. 
5 6°) Reactif selon la revendication 5, caracterise en ce qu'il est choisi 

dans les regions situees entre les nucleotides 3065 et 4390, les nucleotides 6965 et 
9550 ou les nucleotides 2502-2865 de la SEQ ID NO:3. 

7°) Reactif selon la revendication 5, caracterise en ce qu'il est selec- 
tionne parmi les sequences SEQ ID NO:37~57, 59-60 et 121-122 et en ce qu'il est apte 
1 0 a etre utilise comme amorce. 

8°) Reactif selon la revendication 5, caracterise en ce qu'il est selec- 
tionne parmi les sequences suivantes : 

- un fragment de 1505 nt amplifie par le couple d'amorces SEQ ID 
NO:37 et SEQ ID NO:38 (amorces GIF et G1R), 

15 - un fragment de 2529 nt amplifie par le couple d'amorces SEQ ID 

NO:45 et SEQ ID NO:46 (amorces E1F et E1R) 

- un fragment de 182 nucleotides repete deux fois, situe en amont du 
domaine gag aux positions 2502-261 1/2613-2865 

et en ce qu'il est apte a etre utilise comme sonde. 

20 9°) Reactif selon la revendication 5, caracterise en ce qu'il est choisi 

dans le groupe constitue par les fragments codants ou non-codants pour tout ou partie 
de Tenverine et notamment les fragments comprenant au moins 14 nucleotides et plus 
particulierement les fragments codant pour la partie C -terminate de Tenverine, soit a 
partir de Tacide amine 291, soit a partir de l'acide amine 32 L a compter du codon 

25 codant pour la premiere methionine. 

10°) Procede de detection rapide et differentiel des sequences 
nucleiques retrovirales endogenes de type env ou env et gag, de leurs variants 
normaux ou pathologiques, par hybridation et/ou amplification genique, realise a partir 
d'un echantillon biologique, lequel procede est caracterise en ce qu'il comprend : 

30 (a) une etape dans laquelle Ton met en contact un echantillon biolo- 

gique a analyser avec au moins une sonde selon la revendication 5, la revendication 6 
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ou la revendication 8 et 

(b) une etape dans laquelle on detecte par tout moyen approprie le ou 
les produits resultants de F interaction sequence nucleotidique-sonde. 

11°) Procede de detection selon la revendication 10. caracterise en 
5 ce qu'il comprend : 

* prealablement a F etape (a) : 

. une etape de preparation du tissu ou du liquide biologique 

concerne, 

. une etape d'extraction de Facide nucleique a detecter, et 
10 . au moins un cycle d'amplification genique mis en oeuvre a l'aide 

d'au moins un reactif selon Tune quelconque des revendications 5 a 7 et 

* posterieurement a F etape (b) : 

. une etape de comparaison des sequences nucleiques obtenues dans 
ledit echantillon biologique avec les sequences retrovirales endogenes humaines selon 
15 Tune quelconque des revendications 1 a 3, par tout moyen approprie et notamment par 
sequen9age, Southern-blot, coupure de restriction, SSCP ou toute autre methode 
permettant d' identifier une insertion ou une deletion ou encore une simple mutation 
entre les differentes sequences comparees. 

12°) Procede de detection des transcrits selon la revendication 4, 
20 caracterise en ce qu'il comprend : 

- le prelevement des ARN messagers provenant d'echantillons 
biologiques temoins et d'echantillons analogues preleves chez des patients et 

- F analyse qualitative et/ou quantitative desdits ARNm, par hybri- 
dation in situ, par dot-blot, Northern-blot, RNAse mapping ou RT-PCR, a Faide d'un 

25 reactif de diagnostic selon Tune quelconque des revendications 5 a 9. 

13°) Sequences chimeres, caracterisees en ce qu'elles sont consti- 
tuees par un fragment de 17 a 40 nucleotides d'une sequence flanquante selectionnee 
dans le groupe constitue par les transcrits et ADNc des sequences genomiques, qui 
codent pour tout ou partie d'un facteur, dont la fonction, la regulation/deregulation ou 

30 F alteration est associee a F expression normale ou pathologique ou a la regula- 
tion/deregulation de motifs appartenant a ladite famille HERV-7q, ces sequences 
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correspondant a des sequences nucleotidiques codant pour des genes situes dans des 
regions flanquantes situees en amont et/ou en aval d'une sequence retro virale de ladite 
famille HERV-7q dont l'une des extremites ne peut se trouver a une distance excedant 
120 kb, associee a un motif retroviral endogene de type HERV-7q comprenant entre 
5 17 et 40 nucleotides selon les revendications 1 a 4. 

14°) Methode de detection et/ou devaluation d'une sur-expres- 
sion/sous-expression ou d'une modification d'au moins Tune des sequences ou frag- 
ments de sequences retrovirales endogenes de type HERV-7q et/ou de leurs sequences 
flanquantes associees, selon l'une quelconque des revendications 1 a 9, caracterisee en 
10 ce qu'elle comprend : 

- le depot sur un support approprie, de l'ADNc provenant de clones, 
de produits de PCR obtenus a partir d'ADN genomique, de produits de RT-PCR 
provenant de transcrits ou encore de sequences oligonucleotidiques specifiques, 
lesdites sequences d'ADN etant des sequences ou des fragments de sequences retro- 

15 virales endogenes de type HERV-7q et/ou leurs sequences flanquantes, constitutes par 
les transcrits et ADNc des sequences genomiques, qui codent pour tout ou partie d'un 
facteur, dont la fonction, la regulation/deregulation ou 1' alteration est associee a 
1' expression normale ou pathologique ou a la regulation/deregulation de motifs 
appartenant a ladite famille HERV-7q, ces sequences correspondant a des sequences 

20 nucleotidiques codant pour des genes situes dans des regions flanquantes situees en 
amont et/ou en aval d'une sequence retroviral e de ladite famille HERV-7q dont l'une 
des extremites ne peut se trouver a une distance excedant 120 kb et/ou une sequence 
chimere selon la revendication 13, 

- 1' hybridation dudit support avec au moins une sonde marquee de 
25 maniere adequate obtenue, par exemple, par retrotransposition d'un melange d'ARN 

provenant de cellules, de tissus ou de liquides biologiques provenant de temoins 
reputes normaux, de membres de populations ethniques differentes, de patients atteints 
de pathologies souvent associees a une expression de retrovirus, comme les processus 
tumoraux, ou comme les maladies auto-immunes, et 
30 - la detection des hybrides formes. 

15°) Methode selon la revendication 14, caracterisee en ce que ledit 
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transcrit ou ADNc est selectionne dans le groupe constitue par les sequences SEQ ID 
NO:62-67 et 119 et leurs fragments correspondant a un cadre glissant superieur ou 
egal a 14 nucleotides ou leurs sequences complementaires. 

16°) Methode selon la revendication 14 ou la revendication 15, 
5 caracterisee en ce que ledit support comprend en outre toute sequence retrovirale 
endogene ou exogene. 

17°) Kit de detection et/ou d' evaluation d'une maladie auto-immune 
et notamment des neuropathologies a etiologie auto-immune, caracterise en ce qu'il 
comprend outre les tampons necessaires a la mise en osuvre d'un procede selon Tune 
1 0 quelconque des revendications 1 4 a 1 6 : 

- des reactifs A de diagnostic selon Tune quelconque des revendica- 
tions 5 a 9, et 

- des reactifs B constitues par les transcrits et ADNc des sequences 
genomiques, qui codent pour tout ou partie d'un facteur, dont la fonction, la regula- 

15 tion/deregulation ou r alteration est associee a 1' expression normale ou pathologique 
ou a la regulation/deregulation de motifs appartenant a ladite famille HERV-7q, ces 
sequences correspondant a des sequences nucleotidiques codant pour des genes situes 
dans des regions flanquantes situees en amont et/ou en aval d'une sequence retrovirale 
de ladite famille HERV-7q dont Tune des extremites ne peut se trouver a une distance 

20 excedant 120 kb, 

lesquels reactifs sont de preference fixes sur un support approprie. 

18°) Kit selon la revendication 17, caracterise en ce que lesdits 
reactifs B sont selectionnes dans le groupe constitue par les sequences SEQ ID 
NO:62-67 et 119 et leurs fragments correspondant a un cadre glissant superieur ou 
25 egal a 14 nucleotides ou leurs sequences complementaires. 

19°) Produits de traduction, caracterises en ce qu'ils sont codes par 
une sequence nucleotidique selon Tune quelconque des revendications 1 a 4. 

20°) Peptide, caracterise en ce qu'il est susceptible d'etre exprime a 
Taide d'une sequence nucleotidique selectionnee dans le groupe constitue par les 
30 sequences SEQ ID NO: 1-22, 28 et 61 selon Tune quelconque des revendications 1 a 4. 

21°) Peptide selon la revendication 20, caracterise en ce qu'il 
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englobe les peptides derives comprenant entre 5 et 540 aminoacides et notamment un 
fragment de 538 aminoacides, commen9ant a la premiere methionine de la sequence 
SEQ ID NO:26 (enverine). 

22°) Peptide selon la revendication 20 ou la revendication 21, 
5 caracterise en ce qu'il est selectionne dans le groupe constitue par : 

. les sequences SEQ ID NO:23-36 ; 

. la sequence SEQ ID NO:58 ; 

. un fragment C-terminal de la sequence SEQ ID NO:26, soit a partir 
de l'acide amine 291, soit a partir de l'acide amine 321, a compter de la premiere 
10 methionine de la sequence SEQ ID NO:26 ; 

- un peptide de type CKS-17/CKS-25 present dans Tune des 
sequences SEQ ID NO:23-36 ou 58 ; et 

- les peptides presentant une affinite avec un des haplotypes du 
sy steme HLA de classe I ou de classe II et notamment les fragments 399-471, 244-271 

15 de P enverine, ainsi que les peptides de sequence SEQ ID NO:68-l 18, conformement 
au Tableau I. 

23°) Peptide selon Tune quelconque des revendications 20 a 22, 
caracterise en ce qu'il est obtenu a partir des sequences nucleiques selon Tune 
quelconque des revendications 1 a 4, dans lesquelles au moins un codon non-sens peut 
20 etre remplace par un codon codant pour Fun des aminoacides suivants : Phe (F), Leu 
(L), Ser (S), Tyr (Y), Cys (C), Trp (W), Gin (Q), Arg (R), Lys (K), Glu (E) ou Gly 
(G). 

24°) Compositions immunogenes ou vaccinales, pour la protection 
contre les maladies auto-immunes, notamment chez les sujets a risque, caracterisee en 
25 ce qu'elle comprend au moins un peptide comprenant au moins un motif de type CKS 
et/ou au moins un motif selectionne dans le groupe constitue par les peptides presen- 
tant une affinite avec un des haplotypes du systeme HLA de classe I ou de classe II et 
au moins un vehicule pharmaceutiquement acceptable. 

25°) Composition selon la revendication 24, caracterisee en ce que 
30 ledit peptide presentant une affinite avec un des haplotypes du systeme HLA de classe 
I ou de classe II, est selectionnee dans le groupe constitue par les peptides tels que 



WO 99/67395 



PCT/FR99/01513 



60 

definis dans le Tableau I. 

26°) Composition selon la revendication 24 ou la revendication 25, 
caracterisee en ce que ledit peptide presente la sequence SEQ ID NO: 120. 

27°) Anticorps, caracterise en ce qu'il est dirige contre Tun ou 
5 plusieurs des peptides selon Tune quelconque des revendications 20 a 23. 

28°) Composition pharmaceutique, caracterisee en ce qu'elle 
comprend des anticorps neutralisants produits a partir des peptides du Tableau I (SEQ 
ID NO:68-l 18) et leurs homologues. 

29°) Procede de depistage immunologique differentiel de sequences 
10 retro virales endogenes humaines de la famille HERV-7q normales ou pathologiques, 
caracterise en ce qu'il comprend la mise en contact d'un echantillon biologique avec 
un anticorps selon la revendication 27, la lecture du resultat etant revelee par un 
moyen approprie, notamment EIA, ELISA, RIA, fluorescence. 

30°) Procede ^identification et de detection de motifs retro viraux 
1 5 endogenes, anormalement exprimes dans le cadre de pathologies associees au cancer, 
ou de neuropathologies en particulier autoimmunes, au premier rang desquelles la 
sclerose en plaques, caracterise en ce qu'il comprend 1' analyse comparee des sequences 
extraites d'un echantillon biologique avec les sequences selon Tune quelconque des 
revendications 19 a 23. 
20 31°) Application des sequences selon l'une quelconque des revendi- 

cations 1 a 9, 13, 14 ou 19 a 23 au diagnostic, au pronostic, a revaluation de la 
susceptibilite genetique, a toutes maladies humaines induites, innees ou acquises en 
particulier celles a composantes cancereuses, autoimmunes et/ou a incidence neuro- 
logique, comme la sclerose en plaques, les syndromes associes et les maladies neuro- 
25 degeneratives ou intervient tout ou partie des sequences selon Tune quelconque des 
revendications 1 a 5 et des formes endogenes ou exogenes apparentees. 

32°) Sequences nucleiques hybrides, caracterisees en ce qu'elles 
comprennent des sequences ou motifs selon l'une quelconque des revendications 1 a 
9, combines avec des sequences ou motifs d'origine endogene ou d'origine ou induits 
30 de maniere exogene. 

33°) Vecteur recombinant de clonage ou d'expression, caracterise en 
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ce qu'il comprend une sequence nucleique selon Tune quelconque des revendications 
1 a 4. 

34°) Composition immunogene ou vaccinate, caracterisee en ce 
qu'elle comprend un vecteur incluant au moins une sequence nucleique codant un 
peptide tel que defini dans le Tableau I, eventuellement associee a une sequence 
codant un motif de type CKS-17. 

35°) Vecteur de therapie genique, caracterise en ce qu'il comprend 
tout ou partie des sequences nucleiques retrovirales endogenes de type HERV-7q 
selon Tune quelconque des revendications 1 a 4. 

36°) Vecteur selon la revendication 35, caracterise en ce que lesdites 
sequences sont selectionnees dans le groupe constitue par les sequences SEQ ID 
NO:2, 20et21. 

37°) Animaux transgeniques, caracterises en ce qu'ils comprennent 
tout ou partie d'une sequence de type HERV-7q (SEQ ID NO:l-22 , 28 et 61). 
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CCCTGGGGCGGGCTTCCTTTCTGGGATGAGGGCAAAACGCCTGGAGATACAGCAATTATCTTGCAACTGAG 

AGACAGGACTAGCTGGATTTCCTAGGCCGACTAAGAATCCCTAAGCCTAGCTGGGAAG GTGACCACGTCCAC 

CTTTAAACACGGGGCTTGCAACTTAGCTCACACCTGACCAATCAGAGAGCTCACTAAAATGCTAATTAGGCA 

AAGACAGGA GGTAAAGAAATAGCCAATCATCTATTGCCTGAGAGCACAGCAGGAGGGACAA CAATCGGGATA 

TAAACCCAGG CATTCGAGCTGGCAACAGCAGCCCCCCTTTGGGTCCCTTCCCTTTGTAT GGGAGCTGTTTTC 

ATGCTATTTCA CTCTATTAAATCTTGCAACTGCACTCTTCTGGTCCATGTTTCTTACGGCTCGAGCTGAGCT 

TTTG CTCACCGTCCACCACTGCTGTTTGCCACCACCGCAGACCTGCCGCTGACTCCCATCCCTCTGGATCCT 

GCAGGGTGTCCGCTGTGCTCCTGATCCAGCGAGGCGCCCATTGCCGCTCCCAAT TGGGCTAAAGGCTTGCCA 

TTGTTCCTGCACGGCTAAGTGCCTGGGTTTGTTCTAATTGAGCTGAACACTAGTCACTGGG TTCCATGGTTC 

TGTTGTGTGA CCCACGGCTTCTAATAGAACTATAACACTTACCACATGGCCCAAGATTCCA TTCCTTGGAAT 

CCGTGA GGC CAAGAACTCCAGGTCAGAGAATACGAGGCTTGCCACCATCTTGGAAGC GGCCTGCTACCATCT 

TGGAAGTGGTTCACCACCATCTTGGGAGCTCTGTGAGCAAGGACCCCCCGGTAACATTTTGGCAACCACGAA 

CGGACATCCAAAGTGGTGAGTAATATTGGACCACTTTCACTTGCTATTCTGTCCTATCCTTCCTTAGAATTG 

GAGGAAAATACCGGGCACTTGTCGGCCAGTTAAAAACGATTAGTGTGGCCACCGGACTTAAGACTCAGGTGT 

GAGGCTATCTGGGGAAGGGCTTTCTAACAACCCCCAACCCTTCTGGGTTGGGGACTTGGTTTGCCTCAAGCC 

AGCTTCCACTTTCAGTTTTCTTGGGGAAGCCGAGGGCCGACTAGAGGCAGAAAGCTGTCGTCCTGAACTCCC 

GGCAGTAGCCGGTTGAGATCATGGTGTAGCCAGAAGTCTCAACAGTCGCCCATGCATGCACCCCTATCTTTC 

CTTCTGACCCATACCTCCTGGGTCCCAACCACAACTTTCTTCAAAGTGTAGCCCCAAAATTCTCCTTACCTC 

TGAATATACTTCCTCTGATCCCTGCCTCCTAGGTACTATTGGTTCAGACTTCCATTTCCTCTAGCAAGTTGT 

ATCTCCAAAGGGATCTAAGGAAGCTCTGCGCTGCGTCCTTAGGCACCTAGGCTATAACCCAGGGAGTCTTAT 

CCCTGGTGTCCCTCCCAATTTAGGCATACAGCTCTTGACATGGGCAGTTATGTAGGACCCACTCCCCACCAC 

CCTTGCCAGGGCCCCAAGTTTGTAAATGGCTGAGGGAAAAGAGAGACAGAGGAGAGAGAGAGAAATGGAGGA 

GAAAGAGAGAGAGACAGAGAGGAGAGAGAGACAGTGAGAGAGACAGAAGAGAGAGAGAGACAAAGAGGAGAG 

AGAGAGAGTCAAAGAGAGAAAGAAAGAGAAAGAAATAGTAAAAAACAGTGTGCCCTATTCCTTTAAAAGCCA 

.^^m^m>nq>rrr^^n7\^rn7\rr.TrTTrTrTr:Tf:arrrTATAGCACTCCAATCCACTTTG 



T GGTC AGT GT AAAT AAG AGC AT AGGC C GAAAGC AC T CxA.L»bL, Uivr i bHLaHu^^u ± A A x « * - - . 

TCCTTAACCCAGTAACCCGCAGATGGACCAAATGCATTCAGTCGGTAGCGCAACTGCTTTGCTAAAAGTAGA 

AAAGTAACTTTTAGAGGAAACCTCATTGTGAGCACACCTCACCTGTTCAGAATTATTCTAATAAAAAAAGCA 

AAAAGGTAGCTTACTAACTCAAAAATCTTAAAGTATGGGGCTATTCTGTTAGAAAAAGGTAATGTAACTCCA 

ACCACTGATAATTCCCTTAACCCAGCAGATTTCCTAACGGGATTTAAATCTTAATTACCATACAAAGGTCCG 

ACCAGACCTAGGCGGAACTCCCTTCAGGACAGGACGATAGATGGTTCCTCCCAGGTGATTGAGGAAAAAAAC 

CACAATGGGTATTCAGTAATTGATACGGGGACTCTTGTGGAAGCAGAGTTAGAAAAATTGCCTAATAACTGG 

TCTCCTCAAACGTGTGAGCTGTTTGCACTCAGCCAAGCCTTAAAGTACTTACAGAATCAAAAGACTATCTCA 

ATCCTGATTCAAAAGGTTAGCTACACCCTCTCTGTAATGCATTTGCATAAGAACTTGTTTATGGGAATGCAT 

CTTGATGGGGCAGCTGGGTTGTTATAAAATAGGAACCCAGCCCAGCTCTAGGACTCACCCCTGAGCGCAAAG 

flC AATGTTGGGCATGCTGGTAAAGGACCACTAGAATCCAGCAGCCCAGACC CCTTTCTTTGTGGTCAAGAAA 

GGCGGGAAA AGGGGTGCAGGACTGCTACATCGGTAAGCATAACTAAT CCGATAAACAGAGGTCCATGGGTGG 

TTACGC ACCCTGGAAAGGAA C TCACCCCTGAGCACAAAGGCAATGTTGGGCACGCTGGTAAAGGACCAC TAG 

AATCCAGCAG CCTGGACCCCTTTCTTTGTGGTCAAGAGAGGCAGGAAAACAGGT GCAGGACTGCAACATCAG 

TaAflCATAACTAA TTCGATAAGCAGAGGTCCATGGGTGGTGATGCACCCTGGAAAGAA TAAGCATTAGGACC 

ATAGAGGACA CTCCAGGACTAAAGCTCATCGGAAAATGACTAGGGTTGCTGGCATCCCTATGTTCTTTTTTC 

AGATGGGAAACGTTCCCCGCAAGACAAAAACGCCCCTAAGACGTATTCTGGAGAATTGGGACCAATTTGACC 

CTCAGAC RCTAAGfl a iirin&TirrzTirTTAT'&'TTr.TTCTGCAG'TGCCG CCTGGCACTCCTGA GGGAAGTATAAAT 

TA T AA CA CCA TCT TA CAGCTA GA CCTC TTTTGTA GAAAAGGCAAA TGGA G TGAAG TGC CA TAA G TA CAAAC T 

TTCTTTTCATTAA GAGACAACTCACAATTATGTAAAAAGTGTGATTTATGCCCTACAGGAAGCCTTCAGA GT 

C.TACCTCCCTATCC CAGCA TCCCCGACTCCTTCCCCAACTAATAAGGACCCCCCTTCAACCCAA ATGGTCCA 

AAAGGAGATA GACA AAAGGGTAAACAGTGAACCAAAGAGTGCCAATATTCCC C AATTATGACCCCTCCAAGC 

AGTGGCAGG A AGAGAATTCGGCCCAGCCAGAGTGCATGTGCCTTTTTCTCTCCCAGACTTAAA GCAAATAA A 

AACA GACTTAGG TAAA T TCTCAGA TAACCC TGA TGGCTATAT TGA TG TTT TACAAGGG T TAGGA CAA TTCTT 

TGA TC TG ACA TGGAGAGA TA TAA TGTCA C TGC TAAA TCA GA CA C TAAC C CCAAA TGAGAGAAG TGCCA CCA T 

AACTGCA GCCTGAGAGTTTGGCGATCTCTGGTATCTCAGTCAGGTCAATGATAGGATGACAACAGAGGAAAG 

AGA A TGATTCCCCACAGGCCAGCAGGCAGTTCCCAGTCTAGACCCTCA TTGGGACA CAGAA TCAGAACA TGG 

AGATTGGTGCTGC AGACATTTGCTAACTTGTGTGCTAGAAGGACTAAGGAAAACTAGGAA GAAGTCTATGAA 

TTACTCAAT GATGTCCACCATAACACAGGGAAGGGAAGAAAATCCTACTG C CTTTCTGGAGAGACTAAGGGA 

GGCATTGAGGA AGCGTGCCTCTCTGTCACCTGACTCTTCTGAAGGCCAACT AATCTTAAAGCGTAAGTTTAT 

CACTC AGT CAGCTGCAGACATTAGAAAAAAACTTCAAAAGTCTGCCGTAGGCCCG G AGCAAAACTTAGAAAC 

CCTATTGAACTT GGCAACCTCGGTTTTTTATAATAGAGATCAGGAGGAGCAGGCGGAACA GGACAAACGGGA 

TTAAAAAAAAGGCCA CCGC TTTAGTCATGACCCTCAGGCAAGTGGACTTTGGAGGCTCTGGAAAAGGGAAAA 

GCTGGGCAA A TTGAATGCCTAATAGGGCTTGCTTCCAGTGCGGTCTACAAGG A CACTTTAAAAAAGATTGTC 

CAAG TAGAAGTAAGCCGCCCCCTCGTCCATGCCCCTTATTTCAAGGGAATCACTGG AAGGCCCACTGCCCCA 

KGGGACAAAGG TCCTCTGAGTCAGAAGCCACTAACCAGATGATCCAGCAGCAGGACTGAGGGTGCCTG GGGC 

AAGr.GCCATCCCATG CCATCACCCTCACAGAGCCCTGGGTATGCTTGACC ATTGAGGGCCAGGAGGTTGTCT 

rrTr,nAr.ACTGGT GCGGTC TTCTTAGTCTTACTCTTCTGTCCCGGACAAC TGTCCTCCAGATCTGTCACTAT 

r.TGAGGGGG TCCTAAGACGG GCAGTCACTAGATACTTCTCCCAGCCACTAAG TTATGACTGGGGAGCTTTAT 

TGTTTTCACATGCT TTTCTAATTATGCTTGAAAGCCCCACTACCTTGTTAGGGAGAGACA TTCTAGCAAAAG 

rA^finr.rATTATAC ACCTG AACATAGGAGAAGGAACACCCGTTTGTTGTCC CCTGCTTGAGGAAGGAATTA 

ATCCTGAAG TCTGGGCAACA GAAGGACAATATGGACGAGCAAAGAATGCCC G TCCTGTTCAAGTTAAACTAA 

AnGATTCCACCTCC TTTCCCTACCAAAGGCAGTACCCCCTCAGACCCAAGGCCCAA CAAGGACTCCAAAAGA 

TTRTTAAGGACCT AAAAGC CCAAGGCCTAGTAAAACCATGCAGTAACCC C TGCAGTACTCCAATTTTAGGAG 

TACAGAAACCC AACAGACAG TGGAGGTTAGTGCAAGATCTCAGGATTATCAATGAGGCT GTTGT TCCTCTAT 

AGCCAGCTGTACCT AGCCCTTATACTCTGCTTTCCCAAATACCAGAGGAAGCA GAGTGGTTTACAGTCCTGG 

ACCTTCAGGATGCCTTCTT CTGCATCCCTGTACATCCTGACTCTCAATTCTTGTTTGCCTTTGAA GATACTT 
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CAAACC CAACATCTCAACTCACCTGGACTATTTTACCCCAAGGGTTCAGGGATAGTCCCCATCTRTTTGGCC 

AGGC ATTAGCCCAAGACTTGAGCCAATCCTCATACCTGGACACTTGTCCTTCGGTAGGTGGATGATTTACTT 

TTGGCCGCCCATTCAGAAACCTTGTGCCATCAAGCCACCCAAGCGCTCTTCAATTTCCTCGCTACCTGTGGC 

TA CATGGTTTCCAAACCAAAGGCTCAACTCTGCTCACAGCAGGTTACTTAGGGCTAAAATTATCCAAAGGCA 

CCAGGGCCCTCAGTGAGGAACACATCCAGCCTATACTGGCTTATCCTGATCCCAAAACCCTAAAGCAACTAA 

GGG GATTCCTTGGCGTAATAGGTTTCTGCCGAAAATGGATTCCCAGGTATGGCGAAATAGC CAGGTCATTAA 

ATACAC TAATTAAGGAAACTCAGAAAGCCAATACCCATTTAGTAAGATGGACAACTGAAGTAGAAGTGGCTT 

TCCAGGC CCTAACCCAAGCCCCAGTGTTAAGTTTGCCAACAGGGCAAGACTTTTCTTCATATGTCACAGAAA 

A AACAGGAATAGCTCTAGGAGTCCTTACACAGATCCGAGGGATGAGCTTGCAACCTGTGGCATACCTGACTA 

AGGAA ATTGATGTAGTGGCAAAGGGTTGACCTCATTGTTTACGGGTAGTGGTGG CAGTAGCAGTCTTAGTAT 

CTGA AGCAGTTAAAATAATACAGGGAAGAGATCTTACTGTGTGGACATCTCATGATG TGAATGGCATACTCA 

CTG CTAAAGGAGACTTGTGGCTGTCAGACAACTGTTTACTTAAATGTCAGGCTC TATTACTTGAAGGGCCAG 

TGCTGCGA CTGTGCACTTGTGCAACTCTTAACCCAGCCACATTTCTTCCAGACAA TGAAGAAAAGATAAAAC 

ATAACT GTCAACAAGTAATTTCTCAAACCTATGCCACTCGAGGGGACCTTTTAGAGG TTCCTTTGACTGATC 

rrGAr.r.TGAAC TTGTATACTGATGGAAGTTCCTTTGTAGAAAAAGGACTTCGAAAAGTGGG GTATGCAGTGG 

TCAGTGATA ATGGAATACTTGAAAGTAATCCCCTCACTCCAGGAACTAGTGCTCAGCTAGCAGAACT AA _TAG 

CCCTC ACTTGGGCACTAGAATTAGGAGAAGAAAAAAGGGCAAATATATATACAGACTCTAAATATGCTTACC 

TAGT CCTCCATGCCCATGCAGCAATATGGAAAGAAAGGGAATTCCTAACTTCTG AGAGAACACCTATCAAAC 

ATCAGGAA GCCATTAGGAAATTATTATTGGCTGTACAGAAACCTAAAGAGGTGGCAG TCTTACACTGCCGGG 

GT CATCAGAAAGGAAAGGAAAGGGAAATAGAAGAGAACTGCCAAGCAGATATTGAAGCCAAAAGAGCTG CAA 

GGflAGGACCCTCC ATTAGAAATGCTTATAAAACAACCCCTAGTATAGGGTAA TCCCCTCCGGGAAACCAAGC 

rrrAGTACTC AGCA GGAGAAACAGAATGGGGAACCTCACGAGGACAGTTTTCTCCCC TCGGGA CGGCTAGCC 

ACTGAAGAAG G GAAAATACTTTTGCCTGCAACTATCCAATGGAAATTACT T AAAACCCTTCATCAAACCTTT 

CACTTAGGCA TCGATAGCAC CCATCAGATGGCCAAATCATTATTTACTGG A CCAGGCCTTTTCAAAACTATC 

AAGCAGATAG TCAGGGCCTGTGAAGTGTGCCAGAGAAATAATCCCCTGCC TTATCGCCAAGCTCCTTCAGGA 

r.AArAAAGAACA GGCCA TTACCCTGGAGAAGACTGGCAACTGATTTTACCCAC A AGCCCAAACCTCAGGGAT 

TTCAGTATCTA CTAGTCTG GGTAGATACTTTCACGGGTTGGGCAGAGGCCTTCCCCTGTAGGAC AGAAAAG G 

CC.C.A A GAGG TAA TAAAGG CA C TAGTTCA TGAAA TAA T TCCCA GA T TC GGA C TTCCC CGAGGC T TA CA GA GTG 

A C.A A TAGCCCTGCT TT CCA GGCCA CA G TAACCCAGGGAGTA TC C CA GGCG T TA GG TA TACGA TA TCA C T TA C 

A C. TGC.GCC TGAA GG CCACAG TCC TCAGGGAAGG TCGA GAAAA TGAA TGAAA CAC TCAAA GGA CA TC T AA AAA 

Anr.AAACCCAGGA AACCCAC CTCACATGGCCTGCTCTGTTGCCTATAGCCTT A AAAAGAATCTGCAACTTTC 

CCCA AAAAGCAG GACTTAGC CCA TACGAAA TGCTGTA TGGAAGGCCCTTCA T A ACCAA TGACCTTGTGCTTG 
A rr.CA A GA CAGCCAA C T TAG T TGCAGACA TCA CC TC C T TAGCCAAA TA TC A A CAAGTTCT TAAAA CA T TA CA 
AGGAACCTATC CCTGAGAA GAGGGAAAAGAACTATTCCACCCTTGTGACA T GGTATTAGTCAAGTCCCTTCC 
rrrTAATTC CCC ATCCCTAGATACATCCTGGGAAGGACCCTACCCAGTCA T TTTATCTACCCCAACTGCGGT 
TAAAGTGGCTGGAGTGGA G TCTTGGATACATCACACTTGAGTCAAATCCTGGATACTGCCAAAGG AACCTGA 
AAATC.CAGGAGACAACGCTA GCTATTCCTGTGAACCTCTAGAGGATTTGCGCCTGCTCTTCAAACAAC AACC 
ArzrzAGGAAAGTAACT AAAATCA TAAATCCCCATGGCCCTCCCTT A TCATATTTTTCTCTTTACTGTTCTTTT 
Ar.CCTCTTTCAC TCTCACT GCACCCCCTCCATGCCGCTGTATGACCAGTAGCTCCCCT TACCAAGAGTTTCT 
ATGGAGAATGCAGCG TCCC GGAAATATTGATGCCCCATCGTATAGGAGTC TTTCTAAGGGAACCCCCACCTT 

CACTGCCCACACCCA T A TG CCCCGCAACTGCTA TCACTCTGCCACTCTTT G CA TGCA TGCAAA TACTCA TTA 
TTGGAr.AGGAA AAATGATTA ATCCTAGTTGTCCTGGAGGACTTGGAGTCACT GTCTGTTGGACTTACTTCAC 
CCAAACTGGT ATGTCTGA TGGGGGTGGAGTTCAAGATCAGGCAAGAGAAAAACATGTAAAAGAA GTAATCTC 
r.CAACTCACC CGGGTACA TGGCACCTCTAGCCCCTACAAAGGACTAGATCTCTCA A AACTACATGAAACCCT 
^TArnr ATArrrnrrTnGTAAGCCTATT TAATACCACCCTCACTGGGCTCCAT G AGGTCTCGGCCCAAAA 
CCCTACTAACT GTTGGA TATGCCTCCCCCTGAACTTCAGGCCATATGTTTCAATCC CTGTACCTGAACAATG 
GAA CAA C T TCA GCA C AG AAA T AAACACCA C T TCCG T TTTAGTAGGA CCTCT TG T TTCC AA TCTGGA AATAA C 
rrATAnr.TCAAACCTCACCTG TGTAAAATTTAGCAATACTACATACACAACCAACTCCCAATGCATCAGGTG 
GGrAAnTCrTCCCACA CAAAT AGTCTGCCTACCCTCAGGAATATTTTTTGTCTGTGGTAC CTCAGCCT ATCG 
rT ^ rTTr ^ I TGGCTCTTCA~GA * tcta TGTG CTTCCTCTCATT C TTAGTGCCCCCTATGACCATCTACACTGA 

ATCTCAAGA ACTAAATGGG G A n ATGGAACG GGTCGCC GACTCCCTGGTCACCTTGCAAGATCAACTTAACTC 

rr.TA GCA GCAGTAGTCC T TCAAAA TCGA A GAGCT T TAG A CTTGCTAACCGC TGAAA GA GGGGGAA CC TG TTT 
ATTTTTAGGGGAAGAAT GnTGTTATTATGTTAATCAATCCGGAATCGTCACTGAGA AAGTTAAAGAAATTCG 

^^^^^^^^^^^ ^^^^^ 

CCTCCTTGTTAACTTTG TCTCTTCCAGAATCGAAGCTGTAAAAC TACAAATG GAGCCCAAGA TGCAGTCCAA 
GACTAAGATCTACCGCAGACCCCTGGACC GGCCTGCTAGCCCACGATCTGATGTTAATGACATCAAAGGCAC 

CCC TCC T GAGG AAA TC TCA GCTGCACAACC TCTACTA CGC CC CAA TTCAGCAGGAA GCA G IT AG AG C GGT C 

TCC CCCJUlCCTCCCC^ArAn^A^TTA^^^^^^^^Tf;ftr;ATfiRfiP;GACTGAGAGACAGGACTAGCTGGAT 

TTCCTAGG CTGACTAAGAATCCCTAAGCCTAGCTGGGAAGGTGACCACATCCACCTTTAAACACGGGGCTTG 

rAAHTTAGGTCACA CCTGACCAATCAGAGAGCTCACTAAAATGCTAAT TAGGCAAAGACAGGAGGTAAAGAA 

ATAfir.r.AATCATCTATT GC CTGAGAGCACAGCAGGAGGGACAATGATCG G GATATAAACCCAAGTCTTCGAG 

rrr^rAArGGr.AACCCC CTT TGGGTCCCCTCCCTTTGTATGGGAGCTCTGTTTTCATG CTATTTC AC TCTAT 

TaaATr.TTGr.AACTGCAC TC TTCTGGTCCATGTTTCTTACGGCTTGAGCTG A GCTTTCGCTCGCCATCCACC 

ArTr.rTr,TTTffr.n GCCACCGC AGACCCGCCGCTGACTCCCATC C CTCTGGATCATGCAGGGTGTCCGC TGTG 

CTCCTGATCC AGCGAGGCACCC ATTGCCGCTCCCAATCGGGCTAA A GGCTTGCCATTGTTCCTGCATGGCTA 

nnTnrrTRGGTTCA TCCTAA TTGAGCTGAACACTAGTCACTGGGTTCCATGGT'^T TCTGTGA C CCACAG 

CTTCTAATAG AGCTATAACA CTCACCGCATGGCCCAAGGTTC CATTCCTTGAAi^CATAAGGCCAAGAA CCC 

r AGGTr.AGAGAACACG AGGCTTGCCACCATCTTGGGAGC TCTGTGAGCAAGGACCCCCAAGTAACACAACCA 

TGAGGGTGCAAATGCATGG GCCACTAATGGTAGAGCAAGAAAACAGAAGGGCCCTGGTTCCTCGAAGGCATC 

AGTGAGCTGAAATGCCTGCCCTGGATGTCCTATTCCTAGGTGTTTTTCTGCCTGAAGCAGATTAAACCCTTT 

GTTCACTTCTCCAAGTAGGGCTTCTATTACAGCCCAAATCAATCCCCACCCCAGATGACAT 
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ACTGAGAGACAGGACTAGCTGGATTTCCTAGGCCGACTAAGAATCCCTAAGCCTAGCTGGGAAGGTGACC 

ACTGAGAGACAGGACTAGCTGGATTTCCTAGGCTGACTAAGAATCCCTAAGCCTAGCTGGGAAGGTGACC 
ACGTCCACCTTTAAACACGGGGCTTGCAACTTAGCTCACACCTGACCAATCAGAGAGCTCACTAAAATGC 



ACATCCACCTTTAAACACGGGGCTTGCAACTTAGCTCACACCTGACCAATCAGAGAGCTCACTAAAATGC 
TAATTAGGCAAAGACAGGAGGTAAAGAAATAGCCAATCATCTATTGCCTGAGAGCACAGCAGGAGGGACA 



TAATTAGGCAAAGACAGGAGGTAAAGAAATAGCCAATCATCTATTGCCTGAGAGCACAGCAGGAGGGACA 
ACAATCGGGATATAAACCCAGGCATTCGAGCTGGCAACAGCAGCCCCCCTTTGGGTCCCTTCCCTTTGTA 

ATGATCGGGATATAAACCCAAGTCTTCGAGCCGGCAACGGCAACCCCC-TTTGGGTCCCCTCCCTTTGTA 
TGGGAGCT — GTTTTCATGCTATTTCACTCTATTAAATCTTGCAACTGCACTCTTCTGGTCCATGTTTCT 

TGGGAGCTCTGTTTTCATGCTATTTCACTCTATTAAATCTTGCAACTGCACTCTTCTGGTCCATGTTTCT 
TACGGCTCGAGCTGAGCTTTTGCTCACCGTCCACCACTGCTGTTTGCCACCACCGCAGACCTGCCGCTGA 

TACGGCTTGAGCTGAGCTTTCGCTCGCCATCCACCACTGCTGTTTGCCGCCACCGCAGACCCGCCGCTGA 
CTCCCATCCCTCTGGATCCTGCAGGGTGTCCGCTGTGCTCCTGATCCAGCGAGGCGCCCATTGCCGCTCC 



CTCCCATCCCTCTGGATCATGCAGGGTGTCCGCTGTGCTCCTGATCCAGCGAGGCACCCATTGCCGCTCC 
CAATTGGGCTAAAGGCTTGCCATTGTTCCTGCACGGCTAAGTGCCTGGGTTTGTTCTAATTGAGCTGAAC 

CAATCGGGCTAAAGGCTTGCCATTGTTCCTGCATGGCTAAGTGCCTGGGTTCATCCTAATTGAGCTGAAC 
ACTAGTCACTGGGTTCCATGGTTCTCTTCTGTGACCCACGGCTTCTAATAGAACTATAACACTTACCACA 

ACTAGTCACTGGGTTCCATGGTTCTCTTCTGTGACCCACAGCTTCTAATAGAGCTATAACACTCACCGCA 
TGGCCCAAGATTCCATTCCTTGGAATCCGTGAGGCCAAGAACTCCAGGTCAGAGAATACGAGGCTTGCCA 



TGGCCCAAGGTTCCATTCCTTG-AATCCATAAGGCCAAGAACCCCAGGTCAGAGAACACGAGGCTTGCCA 
CCATCTTGGAAGC 



CCATCTTGGGAGC 
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IPMALPYHIFLFTVLLPSFTLTAPPPCRCMTSSSPYQEFLWRMQRPGNIDAPSYRSLSKG 
TPTFTAHTHMPRNCYHSATLCMHANTHYWTGKMINPSCPGGLGVTVCWTYFTQTGMSDGG 
GVQDQAREKHVKEVISQLTRVHGTSSPYKGLDLSKLHETLRTHTRLVSLFNTTLTGLHEV 
SAQNPTNCWICLPLNFRPYVSIPVPEQWNNFSTEINTTSVLVGPLVSNLEITHTSNLTCV 
KFSNTTYTTNSQCIRWVTPPTQIVCLPSGIFFVCGTSAYRCLNGSSESMCFLSFLVPPMT 
IYTEQDLYSYVISKPRNKRVPILPFVIGAGVLGALGTGIGGITTSTQFYYKLSQELNGDM 
ERVA DSLVTLQDQLNSIAAVVLQNRRALDLLTAE 

NTGPWGIiLSQWMPWILPFLGPLAAI ILLLLFGPC I FNLLVNFVS SRIE AVKLQME PKMQ SKTKI YRRPLDRPAS P 

RSDVNDIKGTPPEEISAAQPLLRPNSAGSS 



FIGURE 4 



1 ) NSLAAVVLQNRRALDLLTAESGGTFLFLEEKC 

2 ) NSLAAWLQNRRALDLLTAERGGTCLFLGEEC 

3 ) DSLAAVTLQNHQGLDLLTAEKGGLCYFLGEDC 

4 ) DSLAAVTLQNHQGLDLLIAEKGGLCTFLGEEC 

5 ) DSLAAVTLQNCRGLDLLTAEKGGHYTFLGEEC 

6) LQNRRGLDLLFLKEGGLC 

7 ) DSLAKVVLQNRRGLDLLTAEQGGICLALQEKC 
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TSFVEKANGVKCHKYKLSFHXETTHNYVKSVIYA^ 

ANIPQLXPLQAVGGREFGPARVHVPFSLPDLKQIKTDLGKFSDNPDGYIDVLQGLGQFFDLTWRDIMSLLNQTLTPNER 

SATITAAXEFGDLWYLSQVNDRMTTEEREXFPTGQQAV^ 

MSTITQGREENPTAFLERLREALRKJ^SLSPDSSEGQLILKRKFITQ 

NRDQEEQAEQDKRDXKXGHRFSHDPQASGLWRLWKREKLGKL^ 

LEGPLPQGTKVLXVRSHXPD/ SSSRT 
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CCTGGCACTCCTGAGGGAAGTATAAATTATAACACCATCTTACAGCTAGACCTCTTTTGTAGAAAAGGCA 

CCTGGC-CTCCTGAGGGAAGTATAAATTATAACACCATCTTACAGCTAGACCTCTTTTGTAGAAAAGAAG 
-CAAATGGAGTGAAGTGCCATAAGTACAAACTTTCTTTTCATTAAGAGACAACTCACAATTATGTAAAAA 

GCAAATGGAGTGAAGTGCCATATGTACAAACTTTCTTTTCATTAAGAGATAACTCCCAATTATGTAAAAA 
GTGTGATTTATGCCCTACAGGAAGCCTTCAGAGTCTACCTCCCTATCCCAGCAT--CCCCGACTCCTTCC 

GTGTGATTTATGCCCTACAGGAAGCCCTCAGAGTCTACCTCCCGACCCCAGCAAGACCCCAACTCCTTCT 
CCAACTAATAAGGACCCCCCTTCAACCCAAATGGTCCAAAAGGAGATAGACAAAAGGGTAAACAGTGAAC 



CCAACTAATAAGGACCCCCCTTCAACCCAAATGGTCCAAAAGGAGATAGACAAAGGGGTAAACAATGAAC 
CAAAGAGTGCCAATATTCCCCAATTATGACCC-CTCCAAGCAGTGGGAGGAAGAGAATTCGGCCCAGCCA 

CAAAGAGTGCCAATATTACACGATTAT-ACTCGCTCCAAGCAGTGGGAGGA-GA-ATTT-GGCCCAGCCA 
GAGTGCATGTGCCTTTTTCTCTCCCAGACTTAAAGCAAATAAAAACAGACTTAGGTAAATTCTCAGATAA 

GCGTGCATGTACCTTTTTCTCTCTCAGATTTAAAGCAAATTAAAATAGACCTAGGTAAATTCTCAGATAA 
CCCTGATGGCTATATTGATGTTTTACAAGGGTTAGGACAATTCTTTGATCTGACATGGAGAGATATAATG 

CCCTGATGGCTATATTGATGTTTTACAAGGGTTAGGACAATCCTTTGATCTGACATGGAGAGATATAATG 
TCACTGCTAAATCAGACACTAACCCCAAATGAGAGAAGTGCCACCATAACTGCAGCCTGAGAGTTTGGCG 

TTACTGCTAAATCAGACACTAACCCCAAATGAAAAAAGTGCTGCCATAACAGCAGCCTGAGAGTTTGGCG 
ATCTCTGGTATCTCAGTCAGGTCAATGATAGGATGACAACAGAGGAAAGAGAATGATTCCCCACAGGCCA 

AACTCTGGTATCTCAGTCAGGTCAATGATAGGATGACAACAGATGAAAGAGAATGATTCCCCACAGGCCA 
GCAGGCAGTTCCCAGTCTAGACCCTCATTGGGACACAGAATCAGAACATGGAGATTGGTGCTGCAGACAT 

GCAGGCAGTTCCCAGTGTAGACCCTCATTAGGACACAGAATCAGAACTTGGAGATTGGTGCCACAGACAT 
TTGCTAACTTGTGTGCTAGAAGGACTAAGGAAAACTAGGAAGAAGTCTATGAATTACTCAATGATGTCCA 

TTGCTAACTTGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGAAGCCCATGAATTATTCAATGATGTCCC 
CCATAACACAGGGAAGGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGCATTGAGGAAGCG 

CTATAACACAGGGAAAGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAAGGATTGAGGAAGCA 
TGCCTCTCTGTCACCTGACTCTTCTGAAGGCCAACTAATCTTAAAGCGTAAGTTTATCACTCAGTCAGCT 

TACCTCCCTGTCACCTGACTCTATTAAAGGCCAACTAATCTTAAAGGATAAGTTTATCACTCAGTCAGCT 
GCAGACATTAGAAAAAAACTTCAAAAGTCTGCCGTAGGCCCGGAGCAAAACTTAGAAACCCTATTGAACT 

GCAGAGATTAAGAAAAAACTTCAAAAGTATGCCTTAGGCCCAGAGCAAAACTTAGAAACCCTACTGAACT 
TGGCAACCTCGGTTTTTTATAATAGAGATCAGGAGGAGCAGGCGGAACAGGACAAACGGGATTAAAAAAA 



TGGCAACCTCAGTTTTTTATAATAGAGATCAGGAAGAGCAGG-GGAATGGGACAAATGGGATAAAAAAAA 
A GGCCACCGCTTTAGTCATGACCCTCAGGCAAGTGGACTTTGGAGGCTCTGGAAAAGGGAAAA 

AAAAAAAAGGTGACTGCTTTAGTCGTGGCCCTCAGGCAAATGGACTTTGGAGGCTCCAGAAAAGGGAAAA 
GCTGGGCAAATTGAATGCCTAATAGGGCTTGCTTCCAGTGCGGTCTACAAGGACACTTTAAAAAAGATTG 



GCTGAGCAAATTGAATGCCTAACAGGGCTTGCTTCTAGTGTGGTCTACAAGGACACTTTAAAAAAGATTG 
TCCAAGTAGAAGTAAGCCGCCCCCTCGTCCATGCCCCTTATTTCAAGGGAATCACTGGAAGGCCCACTGC 

TCCAAGTAGAAACAAGCTGCCCCCTTGTCCATGCCCCTTATGTCAAGGGAATCACTGGAAGGCCCACTGC 
CCCAGGGGACAAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATGATCCAGCAGCAGGACTGAGGGTGCC 

CCCAGGAGATGAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATAATCCAGCAGCAGGACTGAGGATGCC 
TGGGGCAAGCGCCATCCCATGCCATCACCCTCACAGAGCCCTGGGTATGCTTGACCATTGAGGGCCAGGA 

CAGGGCAAGCGCCAGCCCATGCCATCACCCTCACAGAGCCTTGGGTATGCTTGACCATTGAGGGCCAGGA 
GGTT GTCTCCTGGACACTGGTGCGGTCTTCTTAGTCTTACTCTTCTGTCCCGGACAACTGTCCTCC 

GGTTCACTGTCTCTTGGACACTGGTATGGCCTTCTCAGTCTTACTCTCCTGTCCTGGACAACTGTCCTTC 
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01/ TAAATCCCCATGGCCCTCCCTTATCATATTTTTCT 

02 / TAAATCCCC-TGGCCCTCCCTTATCATATTTTTCT 

03/ TAAATCCCCATGGCCCTCCCTTATCATATTTTTCT 

04 / TAGATCCTCATGGCCCTCC-TTGTCATATTTTTTT 



01/CTTTACTGTTCTTTTA-CCCTCTTTCACTCTCACTGCACCCCCTCCATGCCGCTGTATGACC 
02/CTTTACTGTTCTCTTACCCCCCTTTCACTCTCACTGCACCCCGTCCATGCGACTGCACCCCC 
03/CTTTACTGTTCTCTTA-CCCCCTTTCTCTCTCACTGCACCCCCTCCATGCTGCTGTACAACC 

0 4/CTTTACTGTTCTCTTA-CCCCCTTTCACTCTCACTGAACCCCCTCCATGCCACTGTACTACC 

01/AGT AGCTCCCCTTACCAAGAGTTTCTATGGAGAATGCAGCGT 

02/GTCCATGCCCGTCTCATGCCAGTAGCTCCCCTTAGCAAGAGTTTCTATGGAGAATGCAGCGT 

03/AGC AGCTCCCCTTACCAAGAGTTTCTATGAAGAATGCGGCTT 

04/AGT AGCTCCCATTACCAAGAGCTTCTATGGACAATGCGGCTT 

01/CCCGGAAATATTGATGCCCCATCGTATAGGAGTCTTTCTAAGGGAACCCCCACCTTCACTGC 
02/CCCGGAAATATTGATGCCCCATTGTATAGGAGTTTATCTAAGGGAACCCCCACCTTCACTGC 
03/CCCAGAAATATTGATGCCCCATCAAATAGGAGTTTACCTAAAGGAAACTCCACCTTCACTGC 
04/CCTGGAAATATTGATGACCCATCGTATAGGAGTTTTTCTAAAGGAAACCCCATTTTCACCAC 

01/CCACACCCATATGCCCCGCAACTGCTATCACTCTGCCACTCTTTGCATGCATGCAAATACTC 
02/CCACACCCATATGCCCCACAACTGCTATAACTCTGCCACTCTTTGCATGCATGCAAATACTC 
03/CCACACCCATATGCCCCACAACTGCTATAACTCTGCCACTCTTTGCATGCATGCAAATACTC 
04 /CCACACCTATATGACCC 

01/ATTATTGGACAGGAAAAATGATTAATCCTAGTTGTCCTGGAGGACTTGGAGTCACTGTCTGT 

02/ AT TAT T GG AC AG G AAAAAC GAT T AAT C C C AG TTGTCCTG G AG G AC T T G G AG 

03/ATTATTGGACAGGGAAAATGATTAATCCTAGTTGTCCTGGAAGACTTGGAGCCACTGTCTGT 
04/ 

0 1 / TGGACTTACTTCACCCAAACTGGTATGTCTGATGGGGGTGGAGTTCAAGATCAGGCAAGAGA 
02/ — GACTCACTTCACTCATACCAGTATGTCTGATGGGGGTGGAGTTCAAGATCAGGCAACAGA 
03/CGGACTTACTTCACCCATACTGGTATGTCTGAGGGGGGTGGAGTTCAAGATCAGGCAAGAGA 
04/ 

0 1 / AAAACATGTAAAAGAAGTAATCTCCCAACTCACCCGGGTACATGGCACCTCTAGCCCCTACA 
0 2 / AAAACACATAAAGGAAGTAATCTCCCAACTGACCTGGGTACATAGCACCCCTGGCCCCTACA 

0 3 / AAAACATGTAAAGGAAGTAACCTCCCAACTGACCCGGGTACAT AGCACCCCTAGCCCCTACA 
04/ 

0 1 / AAGGACTAGATCTCTCAAAACTACATGAAACCCTCCGTACCCATACTCGCCTGGTAAGCCTA 
02/AAGGACTAGATCTCTCAAAACTACATGAAACCCTCCATACCCATACTGGCCTGGTAAGCCTA 
0 3 / AAGGACTAGATCTCTTAAAACTACATGAAACCCTCCATACCCATACTTGCCTGGTAAGCCTA 
04/ 

01/TTTAATACCACCCTCACTGGGCTCCATGAGGTCTCGGCCCAAAACCCTACTAACTGTTGGAT 
02/TTTAATACCACCCTGACTGGGCTCCATGAGGTCTCGGCCCAAAACCCTACTAACTGTTGGAT 
03/TTTAATACCACCCTCACTGGGCTCCATGAGGTCTCGGTCCAAAACCCTACTAACTGTTGGTT 
04/ 

01/ATGCCTCCCCCTGAACTTCAGGCCATATGTTTCAATCCCTGTACCTGAACAATGGAACAACT 
02/GTGCCTCCCCCTGCACTTTAGGCCATACATTTCAATCCCTATACCTGAACAATGGAACAACT 
03/GTGCCTCCCCCTGTATTTCAGGCCATGCATTTCAATCCCTGTACCTGAACAATGGAACAACT 
0 4 / TGCACTTCAGGCCATACATTTCAAT CCCTGTA 
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0 1 /TCAGCACAGAAATAAACACCACTTCCGTTTTAGTAGGACCTCTTGTTTCCAATCTGGAAATA 

0 2 / T C AGC AC AG AAAT AAAC AC C AC TTCTGTTT T AGTAGG T CC T C TTTCCAATCTGGAAATA 

03/ACAGCACAGAAATAAACACCACTTCCGTTTTAGTAGGACCTCTTGTTTCCAATCTGGAAATA 



0 1 /ACCCATACCTCAAACCTCACCTGTGTAAAATTTAGCAATACTACATACACAACCAACTCCCA 
02/ACCCATACCTCAAACCTCACCTGTGTAAAATTTAGCAATACTATAGACACAGCCAACTCCCA 
03/ACCCATACCTCAAACCTCACCTGTGTAAAATTTAGCAATACTGTAGACACAACCAACTCCCA 
04/ 

01/ATGCATCAGGTGGGTAACTCCTCCCACACAAATAGTCTGCCTACCCTCAGGAATATTTTTTG 
02/ATGCATCAGGTGGGTAACTCCTCCCACACGAATAGTCTGCCTACCCTCAGGAATATTTTTTG 
0 3/ATGCATCAGGTGGGTAACTCCTCCCACACGAATAGTCTGCCTACCCTCAGGAATATTTTTTG 
04/ 

01/TCTGTGGTACCTCAGCCTATCGTTGTTTGAATGGCTCTTCAGAATCTATGTGCTTCCTCTCA 
02/TCTGTGGTACCTCAGCCTATCATTGTTTGAATGGCTCTTCAGAATCTGTGTGCTTCCTCTCA 
03/TCTGTGGTACCTTAGCCTATCGTTGTTTGAATGGCTCTTCAGAATCTATGTGCTTCCTCTCA 
04/ 

01/TTCTTAGTGCCCCCTATGACCATCTACACTGAACAAGATTTATACAGTTATGTCATATCTAA 
02/TTCTTAGTGGCCCCTATGCCCATCTACACTGAACAAGATTTATACAATCATGTCATACCTAA 
03/TTCTTAGTGCCCCC-ATGACCATTTACACTGAACAAGATTTATACAATTATGTTGTACCTAA 
04/ 

01/GCCCCGCAACAAAAGAGTACCCATTCTTCCTTTTGTTATAGGAGCAGGAGTGCTAGGTGCAC 
02/GCCCCGCAACAAAAGAGTACCCATTCTTCCTTTTGTTATTGGAGCAGGAGTGCTAGGCGGAG 
03/GCCCCACAACAAAAGAGTACTCATTCTTCCTTTTGTTATCGGAGCAGGAGTGCTAGGTGGAC 
04/ 

0 1 /TAGGTACTGGCATTGGCGGTATCACAACCTCTACTCAGTTCTACTACAAACTATCTCAAGAA 
02/TAGCTACTGGCATTGGCGGTATCACAACCTCTACTCAGTTCTACTACAAACTGTCTCAAGAA 
03/TAGGTTCTGGCATTGGCGGTACCACAACCTCTACTCAGTTCTACTACAAACTATCTCAAGAA 
04/ 

0 1 /CTAAATGGGGACATGGAACGGGTCGCCGACTCCCTGGTCACCTTGCAAGATCAACTTAACTC 
02/CTTAAAGGTGACATGGAATGGGTCGCTGATACCCTGGTCACCTTGCAAGATCAACTTAACTC 
03/CTCAATGGTGACATGGAATGGGTTGCCGACTCCCTGGTCACCTTGCAAGATCAACTTAACTT 
04/ 

01/CCTAGCAGCAGTAGTCCTTCAAAATCGAAGAGCTTTAGACTTGCTAACCGCTGAAAGAGGGG 
02/CCTAGCAGCAGTAGTCCTTCAAAATCGAAGAGCTTTAGACTTGCTAACCGCGGAAAGCGGGG 
03/CCTAGCATCAGTAGTCCTTCAAAATTGAAGAGCTTTAGACTTGCTAACCTCTGAAAGAGGGG 
04/ 

0 1 /GAACCTGTTTATTTTTAGGGGAAGAATGCTGTTATTATGTT 

02/GAACCTTTTTATTTTTAGAGGAAAAATGCTGTTGTTATGTT 

03/GAAGCTGTTTATTTTTAGGGGAAGAATGTTGTTATTATGTTATTTTAGCGGAAGAATGTTGT 
04/ 

01/ AAT C AATC C G G AAT C G T C AC T G AG AAAG T T AAAG AAAT T C GAG AT C G AAT AC A 

02/ AAT C AAT C C GGAAT CAT CACC GAG AAAG T T AAAG AAAT T C AAG G T C G AAT AT A 

03/ TATTATGTTAATCAATCCTGAATTGTCACAGAGAAAGTTGAAGAAATTCGAGATTGAATACA 
04/ 

01/ACGTAGAGCAGAGGAGCTTCGAAA-CACTGGACCCTGGGGCCTCCTCAGCCAATGGATGCCCT 
02/ACGTAGAGCAAAGGAGCTGCAAAA-CACTGGACCCTGGGGCCTCCTCAGCCAATGGATGCCCT 
0 3 / ACGTAGAACAGAGGAGCTTCAAAAACACCAGACCCTGGGGCCTCCTCAGCCAATGGATGCCCT 
04/ 
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01/GGATTCTCCCCTTCTTAGGACCTCTAGCAGCTATAATATTGCTACTCCTCTTTGGACCCTGTA 
02/GGATTCTCCCCTTCTTAGGACCTCTAGCAGCTATAATATTGTTACTCCTCTTTGGACCCTGTA 
03/GGATTCTCCCCTTCTTAGGATCTCTAGCAGCTCTAATATTGATACTCCTCTTTGGACCCTGTA 
04/ 

0 1 /TCTTTAACCTCCTTGTTAACTTTGTCTCTTCCAGAATCGAAGCTGTAAAACTA 

02/TCTTTAACCTCCTTGTTAAGTTTGTCTTTTCCAGAATCGAAGCAGTAAAACTACAAATCGTTC 
03/TCTTTAACCTCCTTGTTAAGTTTGTCTCTTCCAGAATCAAAGTTGTAAAGCTACAAATCGTTC 
04/TCTTTAACCTCCTTGTTAAGCTTGTCTCTTGCAGAATCGAAGCTGTAAAACTACAAATGCTTG 

01/--CAAATGGAGCCCAAGATGCAGTCCAAGACTAAGATCTACCGCAGACCCCTGGACCGGCCTG 
02/TTCAAATGGAGCCCCAGATGCAGTCCATGAGTAAAATCTACCACGGACCCCTGGACCGGCCTG 
03/TTCAAATGGAACCCCAGATGAAGTCCATGACTAAGATCTACCGTGGACCCCTGGACCGGCCTA 
04/TTAAAATAGAGCCCCAGATGCAGTCCATGGCTAAGATCTACCACGGACCCCTGGACCGGCCTG 

01/CTAGCCCACGATCTGATGTTAATGACATCAAAGGCACCCCTCCTGAGGAAATCTCAGCTGCAC 
02/CTAGCCCATGCTCTGATGTTAATGACATCAAAGGCACCCCTCCCGAGGAAATCTCAACTGCAC 
03/CTAGCCCATGCTCCAATTGTAATGATATCGAACGCACCCCTCCCGAGGAAATCTCAACTGCAC 
04/CTAGCCCATGCTCTGATGTTGATGACATTGAAGGCACGGCTTCCGAGGAAATCTCAACTGCAC 

0 1 /AACCTCTACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGCGGTCGTCGGCCAACCTCCCC 
02/AACCTCTACTACGCCCC7^ATTCAGCAGGAAGCAGTTAGAGTGGTTGTTGGCCAACCTCCCC 
03/AACCCCTACTATGCCCCAATTCCGCAGGAAGCAGTTAGACTGGTCGTCAGCCAACCTCCCC 

0 4 /GACCCCTACTACACCCC7VATTTAGCGGGAAGCAATTAGAGCAGCCTATGGCCACCTCCCC 
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CTTCCCCAACTAATAAGGACCCCCCTTTCAACCCAAACAGTCCAAAAGGACATAGACAAAGGA 3 

CTTCCCCAACTAATAAGGACCCCCCTTTCAACCCAAACAGTCCAAAAGGACATAGACAAAGGA 4 

CTTCCCCAACTAATAAGGACCCCCC-TTCAACCCAAATGGTCCAAAAGGAGATAGACAAAAGG 5 

CTTCTCCAACTAATAAGGACCCCCC-TTCAACCCAAATGGTCCAAAAGGAGATAGACAAAGGG 6 

C T T C C C C AAAT AAT AAG AAC CCCCC-TT C AAC C C AAAC G G T C C AAAAG GAG AT AG AC AAAG G G 7 

GTAAACAATGAACCAAAGAGTGCCAATATTCCCTGGTTATGCACCCTCCAAGCGGTGGGAG-- 3 

GTAAACAATGAACCAAAGAGTGCCAATATTCCCTGGTTATGCACCCTCCAAGCGGTGGGAG-- 4 

GTAAACAGTGAACCAAAGAGTGCCAATATTCCCCAATTATGACCCCTCCAAGCAGTGGGAGGA 5 

GTAAACAATGAACCAAAGAGTGCCAATATTACACGATTATACTCGCTCCAAGCAGTGGGAG-- 6 

GTAAACAACTAACCAAAGAATGCCAATATTCCCCGATTATGCCCCCTCCAAGCGGTGGGAG-- 7 

A-AGAATTCGGCCCAGCCAGAGTGCATGTACCTTTTTCTCTCTCAC-ACTTGAAGCAAATTAAA 3 

A-AGAATTCGGCCCAGCCAGAGTGCATGTACCTTTTTCTCTCTCAC-ACTTGAAGCAAATTAAA 4 

AGAGAATTCGGCCCAGCCAGAGTGCATGTGCCTTTTTCTCTCCCAG-ACTTAAAGCAAATAAAA 5 

-GAGAATTTGGCCCAGCCAGCGTGCATGTACCTTTTTCTCTCTCAG-ATTTAAAGCAAATTAAA 6 

-GAGAATTCGGCCCAGCCAGAGTGCACGTACCTTTTTCTCTCTCTAGACTTTAAA TTAAA 7 

ATAGACNTAGGTNAATTNTCAGATAGCCCTGATGGYTATATTGATGTTTTACAAGGATTAGGA 3 

ATAGACXTAGGTXAATTXTCAGATAGCCCTGATGGXTATATTGATGTTTTACAAGGATTAGGA 4 

ACAGACTTAGGTAAATTCTCAGATAACCCTGATGGCTATATTGATGTTTTACAAGGGTTAGGA 5 

ATAGACCTAGGTAAATTCTCAGATAACCCTGATGGCTATATTGATGTTTTACAAGGGTTAGGA 6 

ATAGACCTAGGTAAATTCTCAGATAACCCTAATGGCTATATTGATGTTTTACAAGGTTTAGGA 7 

TTCCTGAGTTCTTGCACTAACCTCAAAT 1 

C AAT C C T T T GAT C T G AC AT G GAG AG AT AT AAT AT T AC T GCT AAAT C AG AC G C T AAC C T C AAAT 3 

C AAT C C T T T GAT C T G AC AT G GAG AG AT AT AAT AT T AC T G C T AAAT C AG AC G C T AAC C T C AAAT 4 

C AAT T C T T T GAT C T G AC AT G GAG AG AT AT AAT G T C AC T G C T AAAT C AG AC AC T AAC CC C AAAT 5 

CAAT C C T T T GAT C T G AC AT GG AG AGAT AT AAT G T T AC T G C T AAAT C AG AC AC T AAC C C C AAAT 6 

C AAT C C T T T GAT C T GAT AT GG AG AG AT AT AAT G T T AC T G C T AAAT C AG AC AC T AAC CCC AAAT 7 

GAGAGAAGTGCCGCCATAACTGCAACCCAAGAGTTTGGCGATCCCTGGTATCTCAGTCAGGTC 1 

GAGAGAAGTGCTGCCATAACTGGAGCCCGAGAGTTTGGCAATCTCTGGTATCTCAGTCAGGTC 3 

GAGAGAAGTGCTGCCATAACTGGAGCCCGAGAGTTTGGCAATCTCTGGTATCTCAGTCAGGTC 4 

GAGAGAAGTGCCACCATAACTGCAGCCTGAGAGTTTGGCGATCTCTGGTATCTCAGTCAGGTC 5 

GAAAAAAGTGCTGCCATAACAGCAGCCTGAGAGTTTGGCGAACTCTGGTATCTCAGTCAGGTC 6 

GACAGAAGTGTCGCCGTAACTGGAGCCCGAGAGTTTGGCAATCTCTGGTATCTCAGTCAGGTC 7 

AATGACAGGATGACAACAGAGGAAAGATAATGATTCCCCACAGGCCAGCAGGCAGTTCCCAGT 1 

AATGATAGGATGACAACGGAGGAAAGAGAACGATTCCCCACAGGGCAGCAGGCAGTTCCCAGT 3 

AATGATAGGATGACAACGGAGGAAAGAGAACGATTCCCCACAGGGCAGCAGGCAGTTCCCAGT 4 

AATGATAGGATGACAACAGAGGAAAGAGAATGATTCCCCACAGGCCAGCAGGCAGTTCCCAGT 5 

AATGATAGGATGACAACAGATGAAAGAGAATGATTCCCCACAGGCCAGCAGGCAGTTCCCAGT 6 

AATGATAGGATGACAACAGAGGAAAGAGAACGATTCCCCACAGGCCAGCAGGCAGTTCCCAGT 7 

G TAG AC C C T C AT TAG G AC AC AG AAT C AG AAC AT G GAG AT TGGTGCCG C AG AC AT T T G C T AAC T 1 

AACT 2 

GTAGCTCCTCATTGGGACACAGAATCAGAACATGGAGATTGGTGCCGCAGACATTTACTAACT 3 

GT AG C T C C T CAT T G GG ACAC AG AAT C AG AAC AT GG AG AT TGGTGCCG CAG AC AT T T 4 

C TAG AC C CTCATTGG G AC AC AG AAT C AG AAC AT G GAG AT TGGTGCTGCAGACATTTG C T AAC T 5 

GTAGACCCTCATTAGGACACAGAATCAGAACTTGGAGATTGGTGCCACAGACATTTGCTAACT 6 

GTAGACCCTCACTGGGACACAGAATCAGAACATGGAGATTGGTGCCGCAGACATTTGCTAACT 7 
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TGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGA TATGAATTATTCAATGATGTCCACT 1 

TGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGA CTATGAATTATTCAATGATGTCCACT 2 

TGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGA CTATGAATTATTCAATGATGTCCACT 3 

TGTGTGCTAGAAGGACTAAGGAAAACTAGGAAGAAGTCTATGAATTACTCAATGATGTCCACA 5 

TGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGAAGCCCATGAATTATTCAATGATGTCCCCT 6 

TGCGTGCTAGAAGGACTAAGGAAAACTAGAAAGAAGCCTGTGAGTTATTCAATGATGTCCACT 7 

ATAACACAGGGGAAAGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGCATTGAG 1 

AT AAC AC AG G G G AAAG G AAGAAAAT C C T AC TGCCTTTCTG GAG AG AC T AAG G G AG G CAT T G AG 2 

ATAACACAGGGGAAAGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGCATTGAG 3 

AT AAC ACAGGG - AAGG G AAGAAAAT CC T AC T GC CT TTCTGG AG AGACTAAGGGAGGC ATT GAG 5 

ATAACACAGGG-AAAGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAAGGATTGAG 6 

ATAACACAGGG-AAAGGAAGAAAATCCTACCGCCTTTCTGGAGTGACTAACGGAGGCATTGAG 7 

GAAGCATACC AGGCAAGTGGACATTGGAGGCTCTGGAAAAGGGAAAAGTTGGGAAAAGTA 1 

GAAGCATACC AGGCAAGTGGACATTGGAGGCTCTGGAAAAGGGAAAAGTTGGGCAAATTG 2 

GAAGCATACC AGGCAAGTGGACATTGGAGGCTCTGGAAAAGGGAAAAGTTGGGCAAATTG 3 

GAAGCGTGCC2 3 2AGGCAAGTGGACTTTGGAGGCTCTGGAAAAGGGAAAAGCTGGGCAAATTG 5 

GAAGCATACC238AGGCAAATGGACTTTGGAGGCTCCAGAAAAGGGAAAAGCTGAGCAAATTG 6 

GAAGCATACC 2 3 3AGGCAAGCGGACTTTGGAGGCACTGGAAAAGGGAAAAGCTAGGCAAATCA 7 

TATGTCTAATAGGGCTTGCTTCCAGTGTGGTCTACAAGGACACTTTAAAAAAGATTGTCC-AA 1 

AATGCCTAATAGGGCTTGCTTCCAGTGCAGTCTACAAGGACGCTTTAGAAAAGATTGTCC-AA 2 

AATGCCTAA 3 

AATGCCTAATAGGGCTTGCTTCCAGTGCGGTCTACAAGGACACTTTAAAAAAGATTGTCC-AA 5 

AATGCCTAACAGGGCTTGCTTCTAGTGTGGTCTACAAGGACACTTTAAAAAAGATTGTCC-AA 6 

AATGCCTAJ^TAGGGTTTGCTTCCAGTGCGGTCTACAAGGACACTTTAAAAAAGATTGTCCAAA 7 

-TAGAAATAAGCCACCACCTCGTCCATGCCCCTTATGTCAAGGGAATCACTGGAAGGCCCACT 1 

GTAGAAATAAGCCGCCCC-TCGTCCATGCCCCTTATGTCAAGGGAATCACTGGAAGGCCTACT 2 

GTAGAAGTAAGCCGCCCCCTCGTCCATGCCCCTTATTTCAAGGGAATCACTGGAAGGCCCACT 5 

GTAGAAACAAGCTGCCCCCTTGTCCATGCCCCTTATGTCAAGGGAATCACTGGAAGGCCCACT 6 

-TAGAAATAAGCCGCCCCCTCGTCCATGCACCTCGTGTCAAGGGAATCACTGTAAGGCCCACT 7 

GCCCCAGGGGATGAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATGA 1 

GCCCCAGGGGACGAAGGTCCTCTGAGTCAGAAGCCACTAACCTGATGA 2 

GCCCCAGGGGACAAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATGA 5 

GCCCCAGGAGATGAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATAA 6 

G C C C C AGGGG AC G T AG G T C C T C T GAG T C AG AAG C C AC T AAC C AG AT G A 7 
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RTPLSTQTVQKDIDKGVNNEPKSANIPWLCTLQAVGEEFGPARVHVPFSLSHLKQIKIDG SDSPDG 

KDPPSTQMVQKEIDKRVNSEPKSANIPQLPLQAVGGREFGPARVHVPFSLPDLKQIKTDLGKFSDNPDG 

YIDVLQGLGQSFDLTWRDIILLLNQTLTSNERSAAITGAREFGNLWYLSQVNDRMTTEERERFPTGQQ 

YIDVLQGLGQFFDLTWRDIMSLLNQTLTPNERSATITAAXEFGDLWYLSQVNDRMTTEEREXFPTGQQ 

AVPSVAPHWDTESEHGDWCRRHLLTCVLEGLRKTRK TMNYSMMST I TQGK 

AVPSLDPHWDTESEHGDWCCRHLLTCVLEGLRKTRKKSMNYSMMSTITQGR 
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GTCTACCTAGCCA-AGGCATATTCTTCTTATGTGGAACATCAACCTATATCTGCCTCCCCACTAACTGGA 

GTCTGCCTACCCTCAGGAATATTTTTTGTCTGTGGTACCTCAGCCTATCGTTGTTTGA--A-TGGCTCTT 
CAGGCACC-TGAACCTTAGTCT™ TTCTAAGTCCCAAC-ATTAACATTGCCCCAGGAAATCAGACCC-TA 

CAGAATCTATGTGC-TTCCTCTCATTCTTAGTGCCCCCTATGACCATCTACACTGAACA--AGATTTATA 
TTGGTACCTGTCAAAGCTAAAGTCCCGTCAGTGCAGAGCCATACAACTAATATCCCTAT-TTATAGGGTT 

CAGTTA — TGTCATATCTAA-GCCCCGCAACAAAAGAGT-ACCCAT-TC-T-TCCTTTTGTTATAGGAGC 
AGGAATGGCTAC-TGCTAC-AGGAACTGGAATAGCCGGTTTATCTACTTC-ATT-A-TCCTACTACCATA 

AGGAGTG-CTAGGTGC-ACTAGGTACTGGCATTGGCGGTATCACAACCTCTACTCAGTTCTACTACAA-A 
C AC T C T C AAAG AAT T T CT C AG AC AGT T T G C AAG AAAT AAT G AAAT C T AT T C T T AC T T T AC AAT C C C AA - T 

CTATCTCAA-GAACTAAATGGGGACATGGAACGGGTCGCCGAC-TCCCTGGTCACCTTGCAAGATCAACT 
TAGACTCTTTGGCAGCAAT-GACTCTCCAAAACCGCCGAGGCCCACACCTCCTCACTGCTGAGAAAGGAG 

TA-ACTCCCTAGCAGCAGTAGTC-CTTCAAAATCGAAGAGCTTTAGACTTGCTAACCGCTGAAAGAGGGG 
GACTCTGCACCTTCTTAGGGGAAGAGTGTTGTTTTTACACTAACCAGTCAGGGATAGT-AC-GAGAT-GC 

GAACCTGTTTATTTTTAGGGGAAGAATGCTGTTATTATGTTAATCAATCCGGAATCGTCACTGAGAAAGT 
C ACC T GGC AT T T - AC AG G AAAG GG C T T C T GAT AT C AG AC AAT G C C T T T C AAAC TCTTATAC C AA CCT 

TAAA-GAAATTCGAGATCGAATA-CAACGTAGAGCAGAGGA-GC-TTCGAAACACTGGACCCTGGGGCCT 
CTGGAGT TGGGCAACATGGCTTCTTCCATTTCTAGGTCCCATGGCAGCCATCTTGCTGTTACTCACC 

CCTCAGCCAATGGATGCCCTGGATTCTCCCCTTCTTAGGACCTCTAGCAGCTATAATATTGCTACTCCTC 
TTTGGGCCCTGTATTTTTAAGCTTCTTGTCAAATTTGTTTCCTCTAGGATCGAAGCCATCAAGCTACAGA 

TTTGGACCCTGTATCTTTAACCTCCTTGTTAACTTTGTCTCTTCCAGAATCGAAGC — T G-TAAA-A 

T G G T CT T AC AAAT G G AAC CC C AAAT G - AG T T C AAC T AAC AAC T T C T AC C AAG G AC C C C T G G AAC GAT C C A 

CT-ACAAATGGAGCCCAAGATGCAGTCCAAG-ACTAAGATCTACCGCAGACCCCTGGACCGGCCTG 

CTGGC — ACT-TCC-AC-T-A — GCC-T-AGAGATTCCCCTCTGGAAGACA-CTACAACTGCAGGGCCCC 

CTAGCCCACGATCTGATGTTAATGACATCAAAGGCACCCCTCCTGAGGAAATCT-CAGCTGCACAACCTC 
TTCTTTGCCCCTATCCAGCAGGAAGTAGCTAGAGCGGTCATCGGCCAAATTCCC-AACAGCAGTTGGGGT 

TACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGCGGTCGTCGGCCAACCTCCCCAACAGCACTTAGGTT 
GTCCTGTTTAGAGGGGGG 



TTCCTGTTGAGATGGGGG 
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ACCTTGCAAGATCAA.CTTA-ACTCCCTAGCAGCAGT-AGTCCTTCAAAATCGAAGAGCTTTAGACTTGCT 



ACTTTACAATCCCAAATAAGACTCTTTGGCAGCAGTGACTC-TCCAAAACCGCTGAGGCCTAGATCTCCT 
AACCGCTGAAAGAGGGGGAACCTGTTTATTTTTAGGGGAAGAATGCTGTTATTATGTTAATCAATCCGGA 



CACTGCTGAAAAAGGAGGACTCTGCACCTTCTTAGGGGAAGAGTGTTGTTTTTACACTAACCAGTCAGGG 
ATCGTCACTGAGAAAGTTAAAGAAATTCGAGATCGAATA- - CAACGTAGAGCAGAGGAGCTTCGAAACAC 

ATAG - CA-TGAGAT - GCCACCCAGCGTTTACAG - GAAAAGGCTTCTGAAATCAGACGCCTTTC - AAATTC 
TGGACCCTGGGGCCTCCTCAGCCAATGGATGCCCTGGATTCTCCCCTTCTTAGGACCTCTAGCAGCTATA 



TTATACCAA CCTCTGGAGT TGGGCAACATGGCTTCTCCCCTTTCTAGGTCCCGTGGCAGCCATC 

ATATTGCTACTCCTCTTTGGACCCTGTATCTTTAACCTCCTTGTTAACTTTGTCTCTTCCAGAATCGAAG 



TTGCTGTTACTCGCCTTTGGGCCCCGTATTTTTAACCTTCTTGTCAAATTTGTTTGGTCTAGAATCGAGG 
C--T G- TAAA-A CT - ACAAATGGAGCCCAAGATGCAGTCCAAG - AC T AAGAT C T AC CG C AG AC 



CCATCAAGCTACAGATGGTCTTACAAATCGAACCCCAAATG - AGTTCAACTAACAACTTCTACCGAGGAC 
CCCTGGACCGGCCTGCTAGCCCACGATCTGATGTTAATGACATCAAAG-GCACCCCTCCTGA-GGAAATC 



CCCTGGACTGACCAGCTGGC - - ACT - TCCCCTG GCC-T-AGAGAGTTCCCCTC-TGAAGGACA- C 

T-CAGCTGCACAACCTCTACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGCGGTCGTCGGCCAACCTCC 



TACAACTGCAAAGCCCCTTCTTCGCCCCTATCCAGCAGGAAGTAGCTAGAGCAGTCATCGGCCAAATTCC 
CCAACAGCACTTAGGTTTTCCTGTTGAGATGGGGG 



C - AACAGCAGTTGGGGTGTCCTGTTGAT - TGAGGG 
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agttgcaattccttgcctcaactctgagagaaaccccagccacatctccagcaaacaaga 

I Mill INN III I I III III Mill IIMIMII I III III I II Ml IIIIII 

agttgcaattccttgcctccactgtgagacaaaccccagacacatctccagcacacaaga 2 2 99 
acttcaaaacacctgaactgcagcagccaggcgttcctccaggaccacctcccccaggat 

Mill III III Ml III IIIIII Mill III MM 

acttcgaaatgcctcaacctcaggtgccaggggttcctccagaaccttctcccccaggag 23 59 
cttgcttcaagtgccggaaatctgaccattgggccaaggaatgcctgcagcccaggattc 

IIIIII MMMM MIMM Ml 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ME IIMIMII 

cttgctacaagtgccagaaatctggccactgggccaaggaatgcccacagaccaggattc 2419 
ctcctaagccacgtcccatttgtgcaggaccccactggaaatcggactgtccaactcacc 

IIMIMII IIIIII I II MIIMMII Mill MUM IIMIMII 

ctcctaagctgtatcccatctctgtgggaccccactaaaaatcagactgttcaactcacc 24 7 9 
cggcagccaatcccagagcccctggaactctggcccaaggctctctgactgactccttcc 

MMMM I I II I I I I I II II II I I II I II I II II II II I I II I II I II Mill 

tggcagccacttccagagcccctggaactctagcccaaggctctctgactgaccccttct 253 9 
cagatcttctcggcttagcagctgaagactgacactgcccgatcacttcagaagtcccct 

MMMM IIIIMMIMMMMMMMIMM MM I II MM I I 

gagatcttcttggcttagcagctgaagactgacactgccagatcgcctcggaagcctaca 25 99 
ggaccatcacggatactgagcttcaggtaactctcacagtggaggctaagtccatcccct 

MINIUM Ml Ml MIMIIMIIIIIIM MM IIIIII MUM 

ggaccatcacagat gctccaggtaactctcacagtagagggtaagtctgtcccct 2 6 54 

gtttaatcgatacaggggctacccactccacatcaccttcttttcaagggcctgtttccc 

IIIIII Ml I MM: Mill I I M II II II I II II I II II II I II 

tcttaatcaatatggaggctacccactgcacattaccttcttttcaagggcctgtttcct 2 714 
tttcccccataactgttgtgggtattgacggccaagcttcaaaaccccttaaaactcccc 

II II MIMMIMMMIMMIIIIIMM Mill Mill MM 

ttgcctccataactgttgtgggtattgacggccaggcttctaaacctcttaaaactcccc 2 7 74 
cactctggtgccaacttggacaacattcttttatgcactctttttcagttatcctcacct 

Mill II MIMM Mill I MIMM IIIIII MM MMMM Ml I 

aactctagtaccaacttagacaatactcttttaagcactcctttttagttatccccactt 2 8 34 
gcccagttcccttattaggccgagacattttaaccaaattatctgcttccccgactattc 

P Mil MMMM II Ml IIIIIIMIIIIIMI MMMM 

gcccagttcccttatgaggccgagacacttcaactaaattatctgcttccctgactattc 2 8 94 
ctgggctacagccacatctccttgccgcccttcttcccaacccaaagcctccttcatatc 

MM MIMM MIMM MM I MM MM IMIMIIIMII III 

ctggactacagctacatctcattgctgcccttcttcccaatccaaagcctcctttgcatc 2 954 
ttcctctcatatccccccaccttaacccacaagtatgggacacctctactccctccctgg 

Ml I I MIMM II II 1 1 I II I II I II 1 1 I II MIMM MIMM III 

ttcttgt atcccccaaccttaacccacaagtataagatacctctattccctccttgg 3 011 
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caaccgatcacacgcccattactatcccattaaaacctaatcacccttaccctgctcaat 

Ml MM I Ml MM Ml I II M I II II I II II I I II I II II I I I II II 

tgaccaatcatgcaccccttaccatctcattaaaacctaatcactcttacccggctcaat 3 0 71 
gccagtatcccataccacaacaggctttaaagggattgaagcctgt tatcacttgcctgc 

MM I Ml Mill II MMMM Mill II II MIMI 

gccaagatcccatcccacagcatgctttaaaaggattaaaacctgttatcactcgcctgc 3131 
tacagcacgggcttctaaaacctataaactctccatacaattcccccattttacctgtct 

M MM M III MM II I I M II I I II II II I II I I I! II I I I II I II II II I 

tagagcatggccttttaaagcctataaactctccttacaattcccccattttacctgtcc 3191 
aaaaaccagataagtcttacaggttagttcagaatctgcaccttatcaaccaaattgttt 

1 1 1 1 1 1 1 ii i 1 1 1 1 1 1 M 1 1 ii i ii i it i ii ii i ii ii ii ii ii i 

tagaaccagacaagccttacaggtt caggatctgtgtcttatcaatgaaattgttt 3 247 

tgcctatccaccctgtagcacccaactcgtacactcttttgtcctcaatgccttccccca 

I MMMM I | | Ml I II Mill I MMMM III II I I 

tccctatccaccctgtggtgctgaacccatatactctcctatcctcaatacctccctcta 3 3 07 
caactcactattccgttcttgatcttaaagatgcttttttcactattcccctgcacccct 

MM M Mill Mill Mill III I M M II II Mill II I Mill I 

caacccattattctgttctagatctcaaacatgctttctttactatccctttacaccctt 33 67 
catcccagcctctctttgcttttacctggactgaccctgacacccatcagtcccagcagc 

II II II I I II I II II I Ml II II II II II II I II I II 1 1 II I II II II II I II II I 

caacccagcctctcttcgttttcacctggactgaccctgacacccatcagtcccagcagc 342 7 
ttacctgggctgtactgccgcaaggcttcagggacagccctcattacttcagccaagctc 

III IN Ill MUM MM MIMI MM I 1 1 I f I i I 1 1 i I 1 

ttacctgggctgtaatgctgcaaggtttcaggggcagcccttattatttcagccaagctc 348 7 
tttctcatgatttactttctttccacctctctgcttctcaccttattcaatatattgatg 

ii ii ii ii i ii i ii ii ii ii 1 1 ii ii i ii i ii ii ii ii i ii ii ii ii ii i ii ii ii 

tttctcatgatttactttctttccacccctccacttctcaccttattcaatatattggtg 3 54 7 
accttctactttgtagcccctcctttaaatcttctcaacaagacaccctcctgctccttc 

I MM II I II I II 1 1 1 1 II II I I 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 i 1 1 ! i II Ml 

atgttcttctttgtagcccctcctttgaatcttctcaacaagacacacttctgctccttc 360 7 
aacatttgttctccaaaggatatcgggtatccccctccaaagctcaaatttcttctccat 

I 1 1 1 M M M I II 1 1 1 1 1 1 1 II II II 1 1 II II 1 1 1 II II I I II II II II I 

agcatttattctccaaaggatatc cccctccaaagctcaaatgtcttctccat 3660 

ctgttacatacctcggcataattcttcatgaaaacacatgtgctctccctgccaattgcg 

I Mill Mill II 1 1 II I II 1 1 1 II I MMMM II 1 1 II II II 1 1 II I I 

ccgttacctaccttggcataattcttcafcaaaaacacacgtgccctccctgctgatagtg 3 72 0 
tctccaactgatctctcaaatcccaacctcttctacaaaacaacaactcctttccctcct 

Ml MMIMMIMM 1 1 I II I I M I M 1 1 1 1 1 1 1 1 1 1 1 M M Mill MM 

tctg- -actgatctctcaaaccccaaccccttctacaaaacaacaactcttttccatcct 3 7 78 
aggcatggttggatacttttgcctttggatacctggttttgccatcctaacaaaatcatt 

II I II II 1 1! I II II II II I M II II II I II II II 1 1 1 1 1 II II II II II I II II 

aggcatggttggatactttcgtgttaggatacctggttttgccatcctaacaaaaccatt 3 838 
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atataaactcacaaaaggaaacctagctgaccccatagattctaaatcctttccccactc 

I I I I I I I I I I ! I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

atataaactcacaaaaggaaacctagttgaccccatagatcctaaatcgtttccccactc 3 8 98 
ctctttccattccttgaagacagctttagagactgctcccacactagctctccctgtctc 

1 1 1 M 1 1 1 1 1 1 1 1 1 ll 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 in 

ctctttccattccttgaagacagctttagagactgtctccactctagctctccctgactc 3 958 
atcccaacccttttcattacacacagccgaagtgcagggctgtgcagtcggaattcttac 

1 1 1 1 1 1 1 1 M i M M 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 

atcccaacacttttcattacacacagctgaagtgcagggctgtgcagtcagaattcttac 4 018 
acaaggaccgggaccatgccctgtagcctttttgtccaaacaacttgaccttactgtttt 

1 1 1 1 1 ii ii 1 1 1 1 I ~ 1 1 1 ii M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

acaaggaccgggatcgcatcctgtagcctttttgtccaaacaacttgaccttactgtttt 4 0 78 
aggctcgccatcatgtctccatgcggtagcttccgctgccctaatacttttagaggccct 

INN I I I I I II I 1 1 I I I I 1 1 I I I II I II I I I I I I II I I I I I I I I I I I I I I 

aggctggccatcatgtctccatgcagcgtctgctgccaccctaatacttttagaggccct 413 8 
caaaatcacaaactatgctcaactcactctctacagctctcacaacttccaaaatctatt 

M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 M 1 1 1 

caaaatcacaaactatgctcaactcattctctacagctctcataatttccaaaatctatt 4198 
ttctttctcacacctgacgcatatactttctgctccccggctccttcagctgtattcact 

Mill II II I I II II I I II I I II I II II I I II II I I I I I M I II I I I I II I II II 

ttcttcctcacacctgacacatatactttctgctccccggctccttcagatatactcact 42 58 
ctttgttgagtctcccacaattaccattcttcctggcccagacttcaatctggcctccca 

I II I 1 1 1 1 M M 1 1 II M M 1 1 MMMMI MMMIIII MMMMI 

c--catttattctcccacaattaccattattcctggcctggacttcaatccggcctccca 4 316 
cattattctggataccacacctgaccctgatgattgtatgtctctgatctacctgacatt 

1 1 1 1 1 1 1 M I : I II 1 1 1 MMMIIII MM II II MMMI! IIIMM II 

cattattctggataccatacctgaccctcatgactgcatctctctgatccacctgacgtt 4 3 76 
caccccatttccccatatttccttcttttctgttcctcatgttgatcacatttggtttac 

1 1 1 1 1 II 1 1 1 1 M 1 1 MMMIIII Mill MM MMMI MUM 

caccccatttccccacatttccttctgccctgtttctcaccctgatcacacttggtttat 44 36 
tgacggcagttccaccaggcctgatcgccactcaccagcaaaggcaggctatgctat 

Ml MMMI I IMIIMI II 1 1 1 1 1 II M 1 1 1 1 i 1 1 1 1 1 M I M I IIIMM 

tgatggcagttccaccaggcctaatcgccactcaccagcaaaggcaggatatgctat 44 93 
gaactgattgccttaactcgggccttcactcttgcaaagggactacacgtcaatatttat 

Mill MMMMI II III IIIIIIIIMIM MMMI IMIIMI III 

gaactagttgccttaattcaagccctcactcttgcaaaaggactacgtgtcaatatctat 4 5 53 
actgactctaaatatgccttccatatcttgcaccaccatgctgttatatgggctgaaaga 

Mill MIIIMMIIIII Mill II M I II 1 1 1 M I M 1 1 1 1 1 1 1 i I M 1 1 1 I 

actgattctaaatatgcctttcatattctgcaccaccatgcggtcatatgggctgaaaga 4 613 
ggtttcctcactacgcaagggtcctccatcattaatgcctctttaataaaaactcttctc 

1 1 1 II II II 1 1 II I MM II II II 1 1 II 1 1 1 II II II II 1 1 II I II 1 1 II II II I 

ggtttcctcactacacaagtgtcctccatcattaatgcctctttaagaaaa-ctctgctc 46 72 
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aaggctgctttacttccaaaggaagctggagtcacacactgcaagggccaccaaaaggcg 

1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 ii i 1 1 1 1 1 ii i i 

aaggctgctttacttccaaaggaagctggggtcatt cactgcaaggggcatcaaaagact 4 7 3 2 
tcagatcccattactctaggaaatgcttatgctgataaggtagctaaagaagcacctagc 

1 1 1 1 1 1 1 1 1 1 1 1 i ii 1 1 1 1 i ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 mm i him i ii 1 1 

tcagatcccattgctctaggcaatgcttatgctgataaggtggctagacaagcagctagc 4 7 92 
gttccaacttctgtccctcatggccagtttttctccttcccatcagtcattcccacctac 

MM i III' I III : I Ill I I II MM MIMIM 

tctccaacttttgtccctcatggccagtttttctccttcacatccgtcactcccacctac 4 8 52 
tcccccattgaaacttccgcctatcaatctcttctcacacaaggcaaatggttcttagac 

II! I MMIIIMI MIMIM llllll I I Mill MIIIIIIMIMII 

tccacagctgaaacttccacctatcaagctcttcccccgcaaggtaaatggttcttagac 4 912 
caaggaaaatatctccttccagcctcacaggcccattctattctgtcatcatttcataac 

I I M II II II II I I I I I II I I I I I I II I II II I I II II I II I I II II II II II I I I IE I 

caaggaaaatatctccttccagcctcacaggcccattctattctgtcgtcatttcataac 4 972 
ctcttccatgtaggttacaagccactagtccacctcttagaacctctcatttcctt-cca 

II MIMMIIMIIII I I III I 1 1 1 1 1 1 1 IMMMIMIMM ill 

cttttccatgtaggttacaagccactagcctgtctcttaggacctctcatttcctttcca 5 0 32 
tcgtggaaacatatcctcaaggaaatcacttctcagtgttccatctgctattctactacc 

II M II II M 1 1 1 1 1 1 1 1 1 1 I II I M II II I 1 1 I II II 1 1 II 1 1 1 M II I Mill 

tcatggaaatctatcctcaaggagatcacttctcagtgttccatctgctattctgctacc 5 0 92 
cctcagggattgttcaggccccctcccctccctacacatcaagctcggggatttgcccct 

Mill IlilMIIIIEil MUM I Ml MM I I I I MM 

cctcagggattgttcaggcctcctccctttcctacacataaagctcggggatttgcccct 5152 
gcccaggactggcaaattgactttactcacatgccctgagtcaggaaactaaaatacctc 

I M II I M 1 1 I I I I M 1 1 I I 1 1 M I Mill MMIIIMI! Ml 

gcccaggactggcaaattgactttactcacatgcctcgggtcagaaaactaaaatatctc 5 212 
ttggtctgggtagacactgtcactggatgggtagaggcctttcccacagggtctgagaag 

II IIIIIIIMIIIIII IIIMM IIIIMIIIIIMIIIMI II IMIIMIM 

ttagtctgggtagacactttcactgggtgggtagaggcctttcccatagagtctgagaag 52 7 2 
gccactgcagtcatttcttcccttctgtcagacataattccttgggttggccttcccacc 

Mill II I II 1 1 II II II II 1 1 1 1 1 II II II 1 1 I II II II I! I MMIIIMI! I 

gccaccgcggtcatttcttcccttctgtcagacataattccttggtttggccttcccttc 53 32 
tctatacagtccaataacggagcagcctttattagtcaaatcacctgagcagtttttcag 

IMIMMM MIMIM MIMIM MM MIMIM MIMIM Mil 

tctatacagtctgataacggaccagcctttactagttaaatcacccaagcagtttctcag 5 3 92 
gctcttggtattcagtggaaccttcgtaccccttactgtcctcaatcttcaggaaaggta 

llll I I : I I 1 1 1 1 I : i 1 1 II MUM MMMMIMU 

gctcttggtattcagtggaaccttcatatcccttaacatcctcaatcttcaggaaaggta 54 52 
gaatggactaatggtcttttaaaaacacaccccaccaaactcagcctccaacttaaaaag 

II 1 j I ! 1 1 j 1 1 I E I 1 1 1 I I I llllll! MUM I ! 1 1 1 1 1 1 M 1 1 i 1 1 1 1 ! I 

aaaccgactaatggtcttttaaagacacacctcaccaagctcagcctccaacttaaaaag 5 512 
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TGCCTTTATTTCCGTAGGCTGGTCATATGGCGCTAGCACTCACATAAAGCTACCGAGGAG 
AGCGAATGAAACCAAAATCACTTTACCTTCACAGCACGAGGCCGTCGTCCCTCTCGATAT 
TTGGCCCGTGTGTCGCATACCGCCCTCTGGACGTGGTGATCAAATAAACTCCCTAGCTCC 
CCGCCGCTCGACGCCATCTTGCCTACTTTGATCCTCGCAGGGAGGACAACATCCGCCCTA 
CTGAGCTCCCTTTTATCCAATAAGAGAGCGGGATGAGTTAAGGAGTGCCAGGATTGGCTG 
GAGAATCGACAGCGTCGGCCATCGTTTCCTGCGTGCGAAGATTTGATGAACGAGGTGCCG 
CCCCCGAGCGGCTCGGCGGAGAGGCGCGGTGGGTGACAGAAGCTTTCTTGTCCCACCCAC 
TACAGGCTTACGGCAGGATGCGCAGCGGGGAGAGGGGGCGGGGCCGCAGGGGGCGGGGCC 
GATCGATCTCCTCCGGCTCCGACGTCCTCGGCCTG CCGGGTCCCGGGTCCTTTGCGGCGC 
TAGGGTGGGCGAACCCAGAGCGACGCTCCGGGACGATGTGGGGCAGCGATCGCCTGGCGG 
GTGCTGGGGGAGGCGGGGCGGCAGTGACTGTGGCCTTCACCAACGCTCGCGACTGCTTCC 
TCCACCTGCCGCGGCGTCTCGTGGCCCAGCTGCATCTGCTGCAG GTAACCTGCCGGCCCC 
GAGCCACCTGATCTTCAGCCTGGGGTCGGACGAGGCCGAAGCCTCTCAGGGACGCGGCGG 
GACACCGGCTGCCACCCGGGCGCCGCCGAAGCGCGCAGAGATCAGGGTCCCTCGACGGCA 
GGGCCCTTCTGGGTAGTCTCTGGATCCCACAAGTCCAGTGCAGCCCTGGGCTCGTCTTAT 
CCCAGGTCTTTTCACTTGGTGAAACTGAACCTAGAAACGTCCTAATATTCTACCACTGTT 
TTTATAAATATTCCTTATTCCAGGCTGGAAAAGCTCCTGAGAAGTGGTTTGTTTTTATTA 
TTTTAAAAGGTGTTTTCCTTGCCAGCCATTTCCAGTTAACCTGCGCTGCTGCCGTCCGGG 
CCGCGAGAGCGGGACGCAGAGTTGTTGGCGGAGCCCCTGTCGGTTCCCGGGGACTAAGCA 
CCGCGTCCCATGAGCGGGAAAGGTTAATACAATGATGGTTCTGCCCTGCGTCGCTGACGC 
GGAACACAGCTGTAGTGTGTTAGGAACACATAACGTAGTTAAGATCACTTGAAGCTCTGC 
GATCAGTCGCCCTTCTGGACGTTGTGGTTAGGATGTTTCACAGTTCTAACCACTGGTGGA 
GATACAGCGTCCATATTTTCATAATTAAAAATAGAGGCACATGGTCTCACGAGTTTGAGT 
GTACTTATGGGGGCAAAAGGACGGCGTATTTGAAATCCTCATAAATCCTGGATGCATGGT 
ACCCACCAGTGGCTAATCTATGCAATGAATAGAGTTTGCAATAATTTCAAGCATCCCTTC 
TTTCCACTTGAGTTACTTCCCCATACCTAGGGGAAGATATTTTTGGTCCACTGAAAACAT 
GAGTTCAGCAGAATCCTCCTATCATCGTCGTTATTATTTTTTACCACTAAGTAGACAATC 
TTTTGGTTTTTGATGGGCTTTATGGCTAGAGACAAATCAGTCACTGTCACCAAGTTCCAG 
GTAGAAGTTGGTTCAGTGCTCTGTCAGCTTCGATGGGATTTTTCAACATGTTTTCAAATC 
TGCACTTAATAGTAGGAATGCTTTCTTACAGTAACTCTAATTTGATCCTAAGATGTAGTT 
GTTACCTTACATTCATCACTGTTTAAGAATTTAGTGGTCTTGATCTTTGTTTTAAATTTT 
GAGCCTTCGGGAAGTACTTATAAGAATTAATTCATGCATATCTTTTTGAAATGTAAATGT 
CTTTAGCCCTGGAACAAATTGCTGTTTCTGTTCAGCCCATATTAGCAGAATAGGTCAACT 
TTACTTTCTAATTATCAATGTAATAAGTTTATTACTTTATAGATTCCATAAATCTATACA 
TTTATTCCTCGATGAATTATATAAATTTATAGAATTTATGTTTTATAGAAAATTTGGAAA 
GCATGGAAAATTATTAACAAGAAAATAAGTTACCCATAATCCCAGAACTTAGAGGTGACT 
AATGTTGACAGTTTGGATCAAATCTTCCAGTTTTGTTTCTAATCTTTATTTTTAACATAA 
ATGAGGTCCTGTATACACACGTACAGTTTTGTGTCCTGGTGTTTTTATTTAATGTTATTA 
TGAGTGTTTTATTTTGTTAAAAGGTCATCATTTTAAGTTGTTAATTAGTATTCTAGCACA 
AATTTGCCATAATTTATTTAATTGTTTACTATGATTGACCATTTAGATTGTACTTAATTT 
TTAGGCATTAGAAGTGATAAACTATATTTTAATCAGACGTTGAAAATAACACATCTTTGT 
TTAGAAAACATCATTTTATTTCTGGTTGTCTAGGATAGATTCCCAGAATTCTTGGGTTAG 
AGGCCATAGATAATTATGAAAGCAGAAAGATTCACAAGTTGGGAGTTAATACTTGAATTA 
CTTTATTTGGGGTGAAGCATTGAGTGCATAATACAGATCATGCAGTAATGGGAAGAAGGG 
TTGGAACAATGGTTTTCTGGCCTATGTCAGACTTACCTTGAAGCTTTTAAGAATACAGAT 
GTTCTGATCAACCCTCAGACCTATTAAATCAGACCTAAAATCTTAGGGAATAGGCTTTAG 
GCATCTCTAATTTTAAAAAATTTATTCAGGCTACTTGGATGCACAAAAGAGTTGAGACCT 
ACTGTCCTAGAATCATAGAATTTTAATGACGATAGAGACCTTAAGCATCTAGGTCGTTTC 
TGTACTTTTACATGTAAGGAAACTGGCATTCCTAGGCCAGTACCATTGCCATGCAGCTAA 
TTTGCCCTCTTGTCTATAGCTCACTCTGCATCACCCAACCTACCGTTCTCACTGTTTCTT 
CTATAACCAATCTCCTTCCCACTTCTGTTCTCTTACTCATGCCATTCTTCCCTCAGTCAT 
TTTTCTTCCTTCCATACAAATTCCATGTCTTTAAAAAGGAATAATCCTACCTCCTCCACA 
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TAGCTTTCCAATTCTCTGTTGCCCACATTTGTCTCCCTTTCAATACTTCTCTGTTGTGTT 
ATGTGACACATCACATTTGATATACTCTGTACTGTGTTTCAAGTATTGTATTCTCTTGTT 
TACTCAAGTCATTATTTCAGGACTGACTACCCAGTAGATGCTTTAAGTCAGGATTTCTCA 
ACCTTGGCACTGTTGACATTTTGAGCTGGATAATTTTTTGTTTTGGGGGCTCTCCTGTAC 
ATTTTAAGATGTTTAACAGCACCCTTGGCCTCTATCCAGTAGACGCCTGTACTGCCTCCC 
CCTATCTGTGACAACCAAAAAGGTCTTCAGACATTGTCAGATGTCTACTGAAGGACAAAA 
TCACCTCTGGTTGAGAACCACCGCTTCAACTAAGTTATCTTCTCTGTACTCAGAACTTGA 
TGTGATTGCAGCAGGGGGAGAGGATTCATATACACAGTGAATGCAAACGAACCTAAATCA 
CCATTCGGATATGGCCACACAATTTTCATTTCCCTTGTGTTAGCAAGAGATACCCTAGGC 
TTTGGACCTGATTATTCCTAAGGCATTCTGATGTATGGTTTTACCTGCAGATTTCCTGGT 
AATACTGATACCTCAGTTTGGGTCAAAGAAGGTCAATTAATTGATTGATTTGATTTGACT 
CCTGGAAAAGACGCTCCTTTCTAGCTGTCTCTTTCTTCTCTTTACCTGAATAGCCAGGGC 
TCTGTGGTTCAAGTGAAGTATTTTGACATAAAAATTAACTTAGAACATTGGTCTGCAGAG 
TTTGCTCAATATAACTGAGCACATATTGTGGCTTTATGGAGCTGGTTACTACTTTTTGAC 
CAAATAAATAATTAGAAGTATTTTTCCTCCTCAATAAGGTTCATTTTTCCTTTTTTCAGT 
GAGCTGGTAGAGTTTCCTTTTTTGATATTTCAGGGCATCTTTCATATTTCCATCTCTTAA 
GTTTCTTCATATGAAGTAGAATTTATCTGGATTATGTATTGCTGACTCTGATGAAAACCC 
ATAGAAAGCATCTGGGGCTTGATCACCTTCATTCTTGTAATAGCTCACACGGTTACAGCT 
GATATGGTAACTTAAGACTTTTGATTCCAAATCTAGGCAAAATACACTCAGTTGAAAGAA 
TTTGTCAGCCAGAACAGTTGGACTGTTCTGTGAAAATTGTGAGAAAAATTACACAACTAA 
GTGATACATGATGATGGCTTTCTTAAATATAAAATTGTAATAACATGGTTAATTTCCAGT 
ACGTTATATTGTCCCAGAAGTGGCTCCAACATTGTTTGAAATTTGTCTCATTTAAAGAAA 
CATAAGCTGGCTATGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCTGAGGCAGG 
CAGATCACCTGAGGTCAGGAGTTCGAGACCAGCCTGGCCAACATGGTAAAACC CCATCTC 
TACTAAAAATACAAAAATTAGCCGGGCATTTGGTGGGGGCCTGTAATCCCAGCTACTTGG 
GAGGCTGAGGCAGGAGAATTGCTTGAATCTGGGAGGTGGAGGTTGCAGTGAGCCGAGATT 
GTGCCACTGCCCTCCAGCCTGGGTGACAGAGTGAGTCTCCGTCTCAAGAAAAAAAAAAAA 
AAAAGCAAGAAACATAAAGACTGGGCATGTTGGCTCATGCCTGTAATCCCAGCACTTTGA 
GAGACTGAGGTGGGAAGATCACTTGAGCCCAGGAGGTTAAGGCTGCAGTGAGCCGTGATT 
TTGCCACTGTACTCGAGCCTGGGCAACACAGTGAGATCCTGTCTCAGGAAAAAAAAAATT 
GCATGTAAATGAATGAATTTGATATTTAATATTTTAAATTATGAAAACTGTTCTGTAGAG 
ATGTAGATCTTGCCATGTTGCCCAGGCTGGCTTTGAACTTCTGGGCTCAAACAATCCTCC 
TGTCTCAGTCTCCCAAAGTATAAAGATTACACATGTGAGCCACTGCACCTGGCCTAATAT 
TTTTAACTTAATGAATTTATTTTGATATAAATAAATTAATAACACTGAAGCTTCCTGATA 
TAATAAGTCTTTTTGTGTGTGTGACGGGTTCTCACTCTGTTGCCCAGACTGGAGTGTAAT 
GGCACTATCATGGCTCACTGTAGCCTCAACCTCCCTGACTCAAGTGATCCTCCCACCTCG 
GCTTCCTGAGTAGATGGGACCACAGGCGTATGCCACCACACCTGGCTGATTTTTAAAATT 
TATTATTGATACATATTAATAAAATTATTTTTATTTTAAAAATGATATATGTGGCTGGGC 
ATGGTGGCTCATGCCTGTAATCCCGACAGTTTGGGAGGCCGAGGTGGGAGGATCACTTGA 
GAC CAGGAGCTT AAGAC CAGC CTAAG CAACATAGTGAGAT C C C ATC T CTAT AG AAAAAAA 
AAATGGCTAGGTGTGGTGGTGTATGCCTATATTCCCAGCTACTCAGGAGACTGAGGTGAG 
AGGATTGCTAGAGCCCAGGAGTTTCAAGTTACAGTGACCTATGATTGTGCCAGTGCACTC 
CAGCCTGGGCAACAGAGCAAAATCCTGTCTCAAAAAAAAAAAAAGTTCGAAAATGCTTAT 
GATGCAATATAAGTAGTGGAAAAGGATATTAAATTGTGC CTAT ATGAACACAAC TAT ATG 
AAAAACTTGCACATAGAGAAAAGGATTAACAAGAAATAGACCAAATTGTTCACATGGTTG 
TCTTGTTTGTGGAGAGAATATCAGTAGTTCATTTGTTTCCTTCCAAGTTTATATGTTTTC 
CGAGGTCTCTATAATGAGTTTGTAATTGTTTAATCATAGAAAACCCTTTTTTGGTCCTTG 
GCCACAAACTTACATGTTTTAATGTAATTGCTTTTTTAATGAGAATAAATGTTATATTTT 
GCTTTTTTAAAACCTATATTCCCATAGTTATATGAGCCCTTACAATTATTAAGAGGCTGC 
ATAATATAACGTTTCTGGAAGGGTACAGAAGAAACAGCAGTAATTACCTCTGAGAACAGA 
GACATGGCTTCACATTTTACCCTTTTGTACGTTTTGTGCTTTTGCCACATGCATTTATTA 
TTCTTCCAATAAATAAGTAAATAAATATGGATTGTATACTCCATCTGGTTGGTGTTTCAT 
AATTCTAAAATTATATTGCTACATTTTTAAAGATGATATGTGTTTCTACTTATTAACGTA 
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TATGTTAAAATAGTAAATTTATATCTTATTTAATAATTTCCCTATTGATAGACATTTAAG 
ACAGTCTCAAGTGTTCACTATCATAGAAAATACTGCACAGATAGCTTTTGCTATAGTTTC 
TTTTTTCTTTGAATCGTTAATTGGGAATAAATGCTCAAATAGTTATATGTGGCTCAACTG 
CTATTTAAGTTTATTGACTGACTGCTGCCATTTTGAATTCTGAAGGGGTTGATTAAATTT 
ATAATGCTGCCATAAGAATATAAGGGTATTGGCTTCATTAGCATCCACCAGCATTGGGTG 
TTGGAAATGATTATAGATTTTTAAATGCTACAACAAATGTAGATAACAGAGAACTATCTA 
TAGAACTCTTTTTGGACATGTGAATTGTAATAATAGTTTATTTTCATGTGAATCCAGAAA 
AATGTATACGAAAACCTTTTTTCCTCTCATTTCTTATATGAATAG AATCAAGCTATAGAA 
GTGGTCTGGAGTCACCAGCCTGCATTCTTGAGCTGGGTGGAAGGCAGGCATTTTAGTGAT 
GGGGGACAG GTAAGCACATGTGATGGCAATAACTTTCTTCTAATATCACATAATATAGCA 
ATAGAAATAAAATTAAAAGTTTAGATTTTTTGTTAAAGGAGGTGAGATGTCACCTAATTT 
GTATGCTATTATGTAACTAGTCTAGGATATTGAAGCTGACTATACTCTGTTTTTAGGTCA 
TTATCTTGTAGTTTACCATACTCCCTACTTGCTTCTTATTCTACTATTTAACTCATTTTC 
CACATCCCCTAATTTTGGTTTCATGAAATTATTTTTCCTTCTGAATTACTAGGTTCTACT 
TACTATTATTAAACTTTATTTCTGACATATTTTATAACCTTCCATGGTCTCACTTGATTA 
AAAATAAAAAATTCAGCTGGGTGCGGTGGCTCACACCTATAATCCCAGCACTTTGGGAGG 
CCAAGGTGGGCGGATAATTTGAGGTCAGGAGTTGGAGACCAGCCTGCCCAACGTGGTGAA 
ACCCCCCCTCTCTACTAAAAATTCAAAAATTAGCTGGGCATGGTGGCAGGTGCCTGTAAT 
CCCAGCTACTCAGGAGGCTGAGGCAGGAGAATTGCTTGAACCTGGGAGGTGGAGGTTGCA 
GTGAGCTGAGATTGCACTGCTGCACTTCAGCTGGGTGACAAGAGCGAAACAATGTCTTGA 
AAAAAAATAAAAAATAAAAAATTCTACAACACAGGGTTATTATTTTTCCATTTTTGTTTT 
CCCTTATGAGTTTAATATGTTTAGATTATAAACCTGAAAGCTTGAATACCTATGTCTATC 
TTTTGTTTTCTTATGTTTATCAAGTTATTCCTTTAAACATTTTCTAAACTGTAAGAATAA 
TGTGAGGCTGGGCTCAATGGCTTATGCCTGTAATCCCAGTGCTTTGGGAGGCCAAGGTGG 
GAGGACCACTTGAGGCCACGAGTTCAAGATTAGCCTGGCTAGGCAACATAGCAAGACCCT 
ATCTCTATAAAAAAATTAAAAAAATTAGCTGGGCATGGTAGCAAATGCTTGTAGTCCCAG 
CTACTCAGCAGACTGAGGTAGGAGGAATGCTTGAGACCAGGAATTTGAGTGACCTATGAT 
TATGCACTCCAGCCCGGGCAATAGCAAGACCCTATCTCTTAAAAGAAGAAGATGTAGTAA 
TAATACATATTCATTATAACTATTTTACCATTGAAAGTAAAAAATGAGTTTTTACCTTTT 
CCCAGTCCCATCCTCAGAATGGGGATCTCAGTAGACCTTTAGGATTGGAAGAATGAGATC 
ATTCATATTTTCTGCAATTATTACCCCACAAAATATTTCAGATACCTTTCCATGTATTAC 
AAACAATGTGCATTTAACATGTCTCTCTCTTTCTCTCTCTCTCTGTGTGCGTCTTCATGA 
TCCTCTGTTGCAGCCCTGCCAGTAAGACACTATCTCCTGAAGAATCACTGATAGGAACAG 
AAAGTGGACTGGCTAGGCCAGGAGTCCTTAGCTTCTTAGGGGGCAGGAGCTGCTTTGTGC 
TTTCTCAGAATCAGATATATATGTGGACTGAAACATTTAAAAACAGAATAGCCAAGGGTG 
CTATACGTTTAAAACTTATATAGATGGGGCTACATTGCTCTCTATTACTAATTTCCCATG 
ACAATACACGAGAGTGCCATGTCTTTTTAACTTGTTTTGAGCACAGACTAATCTTGTTTA 
TGCATGTTTTTTGATGAGAATAGGCTACTCATGAGAAATCTGTAAACCTAACACTAGTCC 
CTTGCATACTCTAAATTGTTGCTAGAATCTTAAAATTTTAGCACCAGACGGACCTTAGAA 
ATCATTAACTTTGGTGCTTTGTTCTACAATACAAGGAGATGGAATATTTTACCCAGGATT 
GCTTAGCAGGTTACAGTTCTGCCCTCTGAGTACCCAGCACTTCCCTGTGGGCAACATCAA 
CTTCCTGATTTTCAAGTCTTAATTAGTACTCTGAAGAATCCTACTTGTTTTTAACTCCCA 
TTTGCTTTGAAGTGACTTTACCTGATTTTTTTAGATCCCTTATTGCAGCAATGCCACTAA 
GAAACTGAGTCTCTAGCTTCTTGGTGGGCAGGAGCTGCTTTGTGCTTGCTCAGAATCATC 
CTTTTCAGTAAGGGAGATATTGAAGAGAAATCTACTGAGGAGTCTGGGGGTGAGGCACTC 
AGGGAAATCCTGCTCCAGTCCACAAAAGCAGAGAGGAAGGGTTGGTTACCTAGAGTATTT 
AACATGCAGAGGCTTTGGATTTTACTCCTTTAATCCTTGGAAATGCCTATGGAAGGGGAA 
AGGAAGTAAGATGGTGACTCCAGCTTATAGACATACTAGTGTTACATATATTTAAACTAT 
AATAGGAGGGTATTATTAGTTTTACTTAACTTTCAACTGTGAAGGATTATACTTCTCAAT 
ATTTGTCTCCAGTGTCTATTTCAGTGTATTTTTCACTTTTCTTGAAGCAGCATGTCTGTT 
GCAAAACTTCTAGAAATAATGAGAATATTTATATATTAGAT CAAGC CATAACTTGATGAT 
ATAGTCATTTCTTCTTATATTTTTTACTTACATTTTTACATTTTAATGATTACTTTCATT 
TTTGAAAAACATGTCATGCTGAGATGTATTTTTCTTCATTCTGTAATTAGTTATGAAACA 
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GTTTTTCCTAAAATGCTGAGTATATCAAGTCTTGGCTAAGAATAAGTAATAAATATTTGC 
CACATGAAAGACTACACATATAGCCAGGTGCAGTGGCTTGCACCTGTTTTCCCAGCTACC 
CAGGAGGCTGAGGCAGGAGGATTGCTTGAGCCCAGGGTTTCCAGGCTGCAGTGAACTATG 
ATTGTACCACTCTACTCCAGAATGGGTGACAGAGCCAGGCCCCATCTCTCAAAACAGAAA 
AGAAAGATTACATAGACTACATATACACCCCCATCCAAAACATACACACACATCTACTTA 
ACCTAAAATGGTAAGAAGATAACTTCTTATTTTCTAATATATGACACAGAAAAGTTTTTT 
TAAAGTAGTTTTAAATTTTTAATTTTTTCTAG GTATTTCTCAAGCCATGTTCCCATGTGG 
TATCTTGTCAACAAGTTGAGGTGGAACCCCTCTCAGCAGATGATTGGGAGATACTG GTAA 
AGAAAACCAAATAAGAACTATCTCATTTAAGGTTAAATTACTTCACAATATCAATGTCTT 
TAGCTTTCTCTAAGCTTTATTATATATTCTGAGTTGGTTTTGAATTATAAGAATGAATTG 
GGGCCAGGCACAGTAGCTCATGCCTATAGTCCCAGCACTTTGGGAGGCCAAGGCAGGTGG 
ATTGCTTGAGTCCAGGAGTTCAAGACCAGGCTGGGCAACATGGTGAAACCCCGTATCTAC 
TAAAAATACAAAAATTAGCCAGGCATGGTAGTGCATGCCATTAGTCCCAGTCACTTGGGA 
GGCTGAGGCAGGAGAATCGCTTGAGCCCGTAAAGTCAAGGCTGCAGTGAGTCAGGATCTT 
GCCATTGTACTCCAGTCTGGAAAACAGAGTGAGACCTTGTCTCAAATAAAAAAAGAATGA 
ATTGATAGAGATCTAATGTACAACCTGACAACTATAGGTAATAAAATTGTATTGGGGATT 
CATGTTAAATGAGTAGATTTTAACTACTCTTACCACAAAAACACAAAAGTGGGTAACTGT 
GAGATGATGTATATGTTAATTTACTTCACTATAGTAACCATTATACTATCTATATGTAGC 
TCATAACACCATGTCGTGTATATTAAATATGCACATTAAAATTTGTTTTTTAAAAAAAGA 
ATTGAGATTTTTTTTAACTAGATATGGAGTGGACAAAATGTAAAGTGAATTGATCTTTTC 
GTCTGTTGGTTCTAG GAGCTGCATGCTGTTTCCCTTGAACAACATCTTCTAGATCAAATT 
CGAATAGTTTTTCCAAAAGCCATTTTTCCTGTTTGGGTTGATCAACAAACGTACATATTT 
ATCCAAATTG GTAGGTGCTATTGTAATATTTGCTGTCATATTCTACACTATAGCATTGAG 
TCCAAAGTAGAAATGAATGTGCACTAATGAGCTTTATTTTCTACACAG TTGCACTAATAC 
CAGCTGCCTCTTATGGAAGGCTGGAAACTGACACCAAACTCCTTATTCAGCCAAAGACAC 
GCCGAGCCAAAGAGAATACATTTTCAAAAGCTGATGCTGAATATAAAAAACTTCATAGTT 
ATGGAAGAGACCAGAAAGGAATGATGAAAGAACTTCAAACCAAGCAACTTCAGTCAAATA 
CTGTGGGAATCACTGAATCTAATGAAAACGAGTCAGAGATTCCAGTTGACTCATCATCAG 
TAGCAAGTTTATGGACTATGATAGGAAGCATTTTTTCCTTTCAATCTGAGAAGAAACAAG 
AGACATCTTGGGGTTTAACTGAAATCAATGCATTCAAAAATATGCAGTCAAAGGTTGTTC 
CTCTAGACAATATTTTCAGAGTATGCAAATCTCAACCTCCTAGTATATATAACGCGTCAG 
CAACCTCTGTTTTTCATAAACACTGTGCCATTCATGTATTTCCATGGGACCAGGAATATT 
TTGATGTAGAGCCCAGCTTTACTGTGACATATGGAAAGCTAGTTAAGCTACTTTCTCCAA 
AGCAAC AGCAAAGTAAAACAAAAC AAAATGTGTTAT C AC C TGAAAAAGAGAAG CAGATGT 
CAGAGCCACTAGATCAAAAAAAAATTAGGTCAGATCATAATGAAGAAGATGAGAAGGCCT 
GTGTGCTACAAGTAGTCTGGAATGGACTTGAAGAATTGAACAATGCCATCAAATATACCA 
AAAATGTAGAAGTTCTCCATCTTGGGAAA GTCTGGGTTAGTATAAATTTTATAACTTGGG 
AGAAATTTTATGTGGCTTAAACATCCCCAAATTATGAATTAGAATAGTATTTCATATATA 
AATTGAAAATCAATTAAAAAGAAACACAGTGCCTAAAGGCACTTGGGGGACACATTTACG 
CTTTGCAGTAAAGTCCTTGTTTGGATAAAGATTGTATGTTTTCTGGCCAAGTAAGCTTGA 
ATAGGTACAAGCTTAGATAGGTTCAGGCCAGAGAGGTCAAAATTACTTGCCTGAGATTGC 
ATAGCTAGTGTTACAACTAGGATTCAAACCCAGGCAGATTGACTTGGGGGTTCATCAGGA 
TGGAGTGCCCTACAAAGCCTCCCATCTTTAATGCTTGCAGATTTGTTCCCCAGTTACCGA 
AAGCAACTTGTTAATATTAGGGAAAAGGGCCAGTGTAGGGAGAGATCCATGGCATGAGGT 
AACCTTCCTGCTGCATGTGGTGGCACCTGGATTGGAATGCATCCAGGAGCTGCTTACCCT 
GCCGGTGTCTGCTCTTTAATTTGTGTATAACGGAGAGGAAGTAGACAGGGCAACTAGTGC 
TCCAGCCCCTCATCCTGGCCACAAATATTAATGCTACCTTTATATGACATAAGTCACTAG 
TCCATTTATTGGAACCTAAATTTGAACCACTGTAAAGTAAGACTTCATAGTGATAAAGAG 
AGGAACTTGTTAGGAAAGAGAATAAAATAGAAAGAGAAGGTTGTCTCCTTTTGTAGATTT 

TCTCTTTGGCCTACATCATTTTCTTTTCTATTTTTTTTTTCCACAAGATGGAGTTTCACT 
CTTCTTGCCCAAGCTGGAGTGCAGTGGCATGATCTGGCTCACTGCAACCTCCGCCTCCCA 
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CGTTCAAGTGGTTCTCCTGCCTCAGCCTCCTGAGTAGCTGGGACTACAGGCATGCACCAC 
CACGCCTGGCTAATTTTTTGTATTTTTAGTAGAAACTGGGTTTCACCATGTTAGCCAGCC 
TGGTCTGGAACTCCTGACCTCAGGTGATCTGCCTGCCTCGGCCTCCCAAAGTGCTGGGAT 
TACAGGCATGAGCCACTGCTCCTGGCCGGCCTACATCATTTTCTAAAGCTCCAGACCATT 
CTTTTCTTTTCTTTTCTTTTCTTTTCTTTTCTTTTCTTTTCTTTTCTTTTCTTTTTTCTC 
TTCTCTTCTCTTCTCTTCTCTTCTCTTCTCTTCTCTTCTCTTTTCTTTTCTTTTTTTGAG 
TTAGAAGCTTGCTTTGTTGCCCAGGCTGGAGTGCAGTGGCACCACCTCCACTCACTACAA 
CCTCCACCTCCCAGGTTCAAATGATTCTCCTGCCTCAGCCTTCAGAGTAGCTGGGACTAC 
AAGTGTGCGCCACCACTCCTGGCTAATTTTTGTATTTTTAGTAGGGACGAGGTTTCACCA 
TGTTGGCCAGGCTAGTCTTGAACTCCTGGTCTCAAGTGATCCGCCTGCCTCAGTCTCCCA 
AGGTGCTGGGATTACAGGCGTGAGCCACTGTGCCTGGCCTCAGATCATTATTTTCTGTTA 
GCTTTAAACTGTCCGTTCAGGAGATCCCACTGCATCCTCAAATTCAAAATATCTAACACT 
GAGCTTATGATTTAGCTGGTTCTGTCATTAGATGGGAATATCCTTTTATTTCCTTGAAAT 
TATATGGTGAGAACAGGGAGAAGTGCTGATGGTAAAGTCCTGTGATTAAGATAGCAATAA 
GGACTCCGCCCTTCCCACTCCACTGAAGGTTGAAGAGCCATGGACAATGAGAAGTCACAG 
T AGGTGAAAT C AGGTAC T AAAATGG AC TTGG CTTG AG AG AT C AAAATT G AT C AC T T GGTG 
ATACAACTAACAAATTCATGTTAACTTGAACCTTTATTACCCTGTGAAGCATGGTGATTA 
AAAAAAAACAACAAACAAACAGGAAACTTGATTGTTAAATTCTCTTTAAGTCAGAATATG 
TACCTTAGAGTTTTTATTTATGCTTTTGTCTACCATTAATATGTCTGCACCTGCTCTTTA 
GAAGTTAATAGAGAGTAAAGTCGTCTTTATGTCTTTCAGTGCTTACTTATATTTGGGAAG 
TTGAGAAAAATTTTTAACATCATTATTGATATATATATATATATATATATATATATATAT 
ATATATATATATATATATATATAGATAATTTTTTTTTTTTTCTTGAGACGGAGTCTCACT 
CTGTCGCCCAGGCCGGAGTGTGGTGGCGATCTCCACTCAATGCAAGCTCTGCCTCCCAGG 
TTCAAGCGATTCTCTTGCCTCAGCCTCCCGAGTAGCTAGGATACAGGCTCCCACCACCAC 
GCCTGGCTAATTTTTGTAGTTTTAGTAGAGACGAGGTTTCACCATATTGGCCACGCTGGT 
CTCAAACTCCTGACCTTGTGATCCGCCCACCTCGGCCTCCCAAAGTGCTGGGATTACAGG 
CGTGAGCCACTGCGCCCGGCTGAGGTAAAATTTAAAGTGTACAATTCAGTCATTTTTAGT 
ATATTTATACTAGTTGTACAGCCATCACCACAATCTAAGTTTAGAACATTTTCATTAGGG 
GGTGGGAGAAATTTTACTCTGCTTTTTAGATTAAGTTTCTGTCTGGATCTAATCATTTAA 
TCAGACAATCAGGCAGATTGTCTGTGATTAGTTTTGGCCATTCCAGCTTCTTCATTGGTT 
GTTAACTTTCACAAATAAAGGCTGCTCAAAGATTAGAAATAACATTTAATTTGAATGTAA 
ATGTGCCATAGTTTAAAAGATGGGTTTGGTGAATACAGTCAAATACATACATTTAAAGCT 
CTAATTCTGAAGATTATGTAAAGAAAAGGAAAGAAATGTAGGGAGAGGATTGAAATGTTC 
ATGGTATAACAATATCTGAACATCCATCTGGTCACACCGTTGGTATTTGAATGTTTTGTC 
CTCCTCAAATTCATATGTCGAAATCCCAACTCCCAAGGTGATCGTATTAGGAGGTGTGGT 
CTTTGGGAAGTGATTAGGTCATGAAGGTGAAGCCTTCATGAATGGGATTCGTGCTCTTAT 
AAAAGAGAACTGTGAGAAATAAGTTTCTGTCGTTTGTTAGCCACCCAGTTTAGGATATTT 
TGATATAGCAGCCTGCATGGACTGAGACAACTATGAGTTATTATGATAGCTTCTGTTATT 
TCACCTAAATTCATAGAAGCTAATATATCAATATTTATGCTATGAAATATTTCTTAACCA 
anrTTTnAATATATTTATATTTTTGTTTATTTTTAAATTTCAG ATTCCAGATGACCTGAG 
GAAGAGACTAAATATAGAAATG C ATG CCGTAGT C AGGAT AACTC CAGTGGAAGTTAC C C C 
TAAAATT C CAAG ATCT CTAAAGTTAC AAC CTAGAGAGAATTTA GTGAGTT C AAAT ATATA 
TGTTACATCAAAATTCTTTTACACGTTTTGTAAGATTTCTAGTTGCTTTAGCTAAGTAAT 
AAGAATGTTGTATTCCTTTTTGATACAAATCTTTTTTTATTGTGTTAAACTATATATAAC 
ATAAAATATGCCATGTTCGCCATTTTTAAGTGTATAATTCAAAGGCATTAATTACATTCA 
TAATATTGT AC AAC CAT C AC C ACT AT CT AT AT C C AG AACT T TT C CAT C AC C C C AAAGAG A 
AACTTGGTACCCATTAAACAATAATTCCCCGTCCACTCCTTTCCCCAGTCCCTGGTAATC 
TCTAATGTATATTGTGTCTCTATGAATTTACTTATTCTAGATATTTCATATATAAGTAGA 
AGTATGCATTTGTCTTATGTATCTGACTTATTTCATTTAACATAATGTTTTCAAGGCTCA 
TCTGTGTTGTATGTATCAGAATGTTATTCCTTTTCATGGCTGAATACTATTCCATTGACT 
GCATATACCACATTTGTTTATCCATTCATCTGTTGATGGACACTTGGGTTGTTTCCACAT 
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TTTTGGCTGCTGTGAATAATGCTACAGTGAACATTGGTGTACAAGTATCTGTTTGAGTTC 
CTCTTTTCAGCTCCTTTGGGATATACCTAGGAATTATGTTTAACTTTTTGAGAAGCTGAG 
AAATCTTTAATAAATGATAACACAAATACTTATATTTGCCAATGCAAATATGAATATTTT 
TGG C TTTTAAGAGATTGATCATTTTG CC ACGTGGTTGTAAT TAAAAAAAAT TGTC C C ATG 
TTGTTTCAGTATTAATATTGTAGCCTAAAAGAGTGCTAGACTGTTTTACTTTTTACTCAG 
TTAATTCTTTGGATACTGGTAGAGTCAGGAAATGAGATATTGAACTTAAAGATCTTTGCA 
GGTGGGGTCCAGTGGCTCACACCTGTAATCCTAGCACTTTGGGAAGCTGAGGTGGGAGGA 
TTGCTTGAGGCCAAGAGTTTGAGAATAGCCTGGGCAACATAGCAAGACCCCATCTCTACA 
AAAAAATTAAAAAAAAAATTAAGCCAGGCGTGGTAGCTCACGCCTGTTATCCCAACACTT 
CGGGAGGCTGAGATGGGTGGATCACTTGAGGTCAGGAGTTGGAGACCAGCCTGGCCAACA 
TGGTGAAACCCCATCTCTACTAAAAATACCAAAATTATCGGGGCGTGGTGCTAATCCTGT 
AATCTCAGCTACTCAGGAGGCTGAGGCAGGAGAACCACTTGAACTGAGGAGGTGGAAGTT 
GCAGTGAGCCTAGATCTCACCACTGCACTCCAGCCTGGGTAACAGAGCGAGACTCTATTT 
CAAAAAAAGTAAAAATAAAAATTAGACACATGTGGTGGCACATGCCTGTAGTCCTAGCTA 
CTCAGGAGGCTGACTGAAGTGGGAGGATCTCTTGAGCCCAGGAGTTCCACACTGCAGTGA 
GCTATGATTGTGCCACTGCACTCCAGCCTAGGCAATATCTCAAAAAAAATTTTTTTAAAT 
AGATTATTAGGCCAGACGTGGTGGCTCATGCCAGTAATCCCAGCACTTTGGAAGGCCAAG 
GCAGGCGGATCACCTGAGGCCAGGAGTTTGAGACCAGCCTGGCCAACATGGTGAAACCCC 
ATGTCTACCAAAAATACAAAAATTAGCTGCAATGTCTATAATCCCAGCTACTTGGGAGCC 
TGAGGCAAGCGAATCGCTTGAACCCGGGAGGCAGAGGTTGCAGTGAGTGGAGACTGCGCC 
ACTGCACTCCAGCCTGGGCGATACAGCGAGATTCTGTCTCAAAGAAAAAGGAATTTGTTT 
TCCTGTCTTTATCGTAGAGGGAGGAAAGGGAGAATGGGGTTGGAATGGTTATTGAGTGAG 
CCACATTATGGTAGATGTATCACTGGGCATAGAGAAAAGGAGCATTTAAAACTTTTCCGC 
CTAACAGATGTTTCTTCAGGCTACACTGCACTCATTGTGCTAACTGTAATGTCAAATCCC 
AGACCTGTGCCTATAGAACATGAACATCCTTCATTGGATTTGTTTGGTCAGGCTTACACT 
TTATTAGGAAGATCAGATGTTAAAATAAGGGTGTTAAAGTTAAGTTCAGATATGAGGATA 
ATTCATTACTATTCCTTTTTCTGGCAG CCTAAAGACATAAGTGAAGAAGACATAAAAACT 
GTATTTTATTCATGGCTACAGCAGTCTACTACCACCATGCTTCCTTTGGTAATATCAGAG 
GAAGAATTTATTAAGCTGGAAACTAAAGATG GTGAGTACATTTGTTATTTTGACTTTTTT 
TTCTATTTAAATAGTTGTACATTTTTAATTGTTCTTGCAACCTGTCATACCTGTGAACAG 
TATGTGAATAGTGAAATATAATTATGATAATTAAACAGTAGTTTTTATGTATTGAAAAAT 
ATCTTTGGCCGGGTGCAGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCCGAGGCA 
GGCGGATCACTTGAGGCCAGGAGTTCGAGAGCAGCCTGCCAACATGGCGCAACCCTATCT 
ATACAAAAAAATACAAAAATTAGCCTGACATAGTGGTGTATGCCTGTAGTCCCAGCTACT 
TGGGAGGCTGAGGCAGAAGGATCACTTGAGCCCAGGAGGTCTGTGTTCCTGCCACTGCAC 
TCCAGCCTGGGCAGCAGAGTGAGACCCTGTTGGGGGGAAAAAAAAAAAAGTCTTTAACTT 
AAATAAATTTGACATTTAAAATCTTAAATTATTTCATCTCTGTTTCAGTACTAACTCTGC 
ATTTATTACTTTCTTTTTAATAG GACTGAAGGAATTTTCTCTGAGTATAGTTCATTCTTG 
GGAAAAAGAAAAAGATAAAAATATTTTTCTGTTGAGTCCCAATTTGCTGCAGAAGACTAC 
AATACAA GTAATAGCATGTTATTGAATATTTAATAAAATACTATTTGTTACATATGATTG 
ATAATAAAGTATGAAGTTCCTTGTAACACCTTGCATTGTGAAGTGTATTAAAAACCTGCT 
AAGAGTAAGGAATAACTTGATTTAAAATATTTTATTCTGTAATCTCTTTAAATTATCTGT 
ACAAATTATTGACTTAACCTAAATTTAAAAATGAATGCCTTAGCACAATTAAGTTCCAAG 
AATAGAGTTGATCATGTTAACTGGTAAATGGATCATGATTTAAAATTCTTCTAGGATTGA 
AACAAATGAAAACGTAGTTTTAAGGGTTTGATTTTTTAAATTCCTATTTTTACATGCAAT 
TTTACTGCACAACCCATCTTATTTTGACAGTTCTTAAATTCGCAACTCTTCAGAAATATT 
ATCAGATCACTTTTCTTTGCTTCCATAAGTTTTTTTATTATTATATTATTATTTTTTTTT 
TTTAAAAGACGGTGTCTCACTTTGTCGCCCAGGCTGGAGTGCAGTGGCATGATCATGGCT 
CACTGCAGCCTCGACCTCCCAGGCTCAGGTGATTCTCCCACCTCAGCCTCCCAAGTAGCT 
GGGACCACAGGCGAATGCCATGATGCCTGGCTAATTTTTGTATGTTTTGTAGAGATAGGG 
TTTCACCATGTTGCCCAGAATTGTCTTGAACTCCTGGGTTCAAGCAGTTGTTCTGCCTTG 
CCCACCCAAAGTTGTGGGATTACAAGTGTGAGCCACTGCGCCCAGCTATTCTAGAAGTAT 
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TTTAAGAGTCATCTTTTTTTTTTTTTTGAGATGGAGTCTCACTCTGTCACCCAGGCTGGA 
GTGCAGTGGCACACTCTCGGCTCACTGCAACCTCCACCTCCTGGGTTCAAGTGATTCTCC 
TGCCTCAGCTTCCCTAGTAGCTAGGATTACAGGCGCATGCCACCATGCCCTGCTATTTTT 
TGTAGTTTTAGTAGAGACGAGATTTCACCATGTTGGCCAGGCTGCTCTTGAACTCCTGAC 
CTCAAGTGATCTGCCCTCCTCAGCCTCCCAAAGTGCTGGGATTCTAAGTGTAAACCACCA 
CACCCAGCCAAGAGTGGTCTTTTTACAATATTATTTTTTGATTAGGACATTCATTCTTGT 
CATAAAATTGAAGATACTCTAGTCATTTAGAATTTCATTGTTTTGGAACTAGACATTGTT 
TCTTTATTTTTGAAATGTTATTGAAGGAATACCATTTGGAGAAGATACAAATGTAAGAAT 
TGTGAAAAGGATAATTGTGACACAAATCAAAATTATAGATAAAAATATACCTGTAAAATG 
TATTAAGGCAATAACATTCTTTCTGCTTGTTGACCATAAATATTTATATTCCCTGGATGG 
GTACATTGTTATTGTCAAGGGTGTTTAAATAATGATCTTGCATGCATAATTTATTCTCTC 
TGGTATAACAGAATCAGCAATTTAGTTTTCTGGGACCCGAGAAAAACATGCAAAAGACAT 
ACTTTGAAATGTAAAACTGATTTTTCCTTGCAACTGTAG GTCCTTCTAGATCCTATGGTA 
AAAGAAGAAAACAGTGAGGAAATTGACTTTATTCTTCCTTTTTTAAAGCTGAGCTCTTTG 
GGGTAAGAAGTTATGGCCAAACTAGCATGTTAGACATGTTTTTAACACTATATCTGGCAG 
AGTTTTCAATGTAAATATTAAAGTAGATGTTAATGTCAATAAGTGATCTTAATAATGCAT 
CAGTAGATATTTTTTCAAGGATTGTCTCTATCTTCACGCCTAGCTTATAATTTGCCTTGT 
CGTCTTTTTTTTTTTCTCTTTATTTTTATGTTTTTATCCATCCCTGGTGGTAGGGGATAA 
CCTTGTCTTCTTCGATAACAAGAAGTCTGAAGCTTATTAGAAATTTTACTTTGAGAATTG 
ATCGATGAGAAGAAAGCAACTAGATATCACGTGGATCATATATGCTTGAATAAAACAATA 
ATTCTTAGAACAAATAAATACATTTTAAAAGTTAAAGCCAAAAACATTAGTTGAATGTTT 
AAAAATATTTCAAATTAAGTTATTCCTTCACTGTCTTGTATTACTGTAATAATTTGGATT 
ATTTGTGTTTTTCTCAACTTTTAAAACAAATATTTAAAAAATTCCTCTTTTGATTAAGTA 
GGGCTAGATAAAATATAAAAAATATTTTTTAAACTCCTCTTAATTTCCATATTTCTTATA 
TAATATGAGAATCTCTTATAAACACTACCTCTTAGAAGTCTCCACAGAAGCTTTGGTAGA 
TGTAGTAGTAGGGATTTGATTTCTTAGAATGGTATAATCTGTAAATGTTTTAGTAAAAGG 
ATTAAACGATAAAGTCAAAATGTTTATAGCACAGTGTTTATTAATATAAAATAAAATCTC 
TTTTTTTTTTTTTGAGATGGACTCTCACTTTGTCACTCAGGCTGGAGTGCAGTGTTGCAA 
TCTCAGCTCATTGCAACCTCCGCCTCCTGGGTTCAAGCAATCCTTCCGCATCAGCCTCCT 
AAGTAGCTGGGATTACAAGCATGCACCACCACACCTGCCTAATTTTTTGTATTTTTAGTA 
GAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCAAGTGATCCGCCTGCCTCAGCCTC 
CCAAAGTGCTGGGATTACAGGCGTGAACCACTGTGCCCAGCATAAAGTAAAATCTCTTCA 
GACTCTCATGTGATCATGTAAAGTGGCAGGCAGTCACAGTCAAGAAGTAGTTTAAAGTTC 
ATGTTTGTAAAATATAATCTACAGATTGATACTGGATTTCATAGGTAATGTTTAAGAGAA 
AATAAGTTTTTAGTTATCCTCAGTACTTCAAAAGCACCCATTTATGATTATGTTGATTAC 
TAAACTAAATCATTTGGGGGCTAGAGGTGTTTTTTTATGTGTTAAGATTCCTTAAGGAGT 
TCTATTAGGGCAAAACTTTTAGTAACTGCATATTTTAAAAGTAATAAAACTAATTTTAAA 
AGCTTGGAGGCTGGGCGCGGTGGCTCACACCTGTAATTCCAGCACTTTGGGAGGCCAAGG 
CGGGTGGATCACTTGAGGTCAGGAGTTTGAGACGAGCCTGAGCAACATGGTGAAACCTTG 
TCTCTACTAAAAATACAGAAATTAGCCAGGTGTGGTGGTGGGCACCTGTAATCCCAGCTA 
CTCGGGAGGCTAAGGCAGGAGAATTGCTCGAACTTGGGAGGCAGAGGTTGCAGTGAGCCG 
AGATCATGCCACTGCACTCCAGCCTGGGTGACAGAGCAAGACTCCGTCTCAAAAAAAAAA 
AAAAAAAAAAGCTTGAAGTCAGATTCGACATTAATCAGTATACTTTCTCTCAAGTAGGGG 
ACAATTTCTAAGATTTTAGTCTTTTAAAATTTATTAACTAGTCTGAGCATGGTGGCTTGT 
GTCTATAATCCCAGCACTTTGTGGGGCCGAGGCAGATGGATCACTTGAGCCCAGGAGTTG 
GAGACTAGCCTGGGCAACATGGCAAAACCCCGTCTCTACAACAAATGCACACACAAAAAA 
CCCAATCAGCTGGGTGTGGTGTTACACTCCTGAAGTCCCAGCTACTCGGGAGGCTGAGGC 
AGGAGGATCACCTTTGCCAGGGCGTTTGAGGCTGCAGGGAGCTGGGTTCACACCACTGCG 
CTCCAGCCTGGATGACACAGCAAGCCCCTTTCTCAAAAAAAAAAAGATAAAAAATTAAAT 



CCTGCTTCAGTCTTTTATCATGTAACTATGTATATTTTTTACAG AGGAGTGAATTCCTTA 
GGCGTATCCTCCTTGGAGCACATCACTCACAGCCTCCTGGGACGCCCTTTGTCTCGGCAG 
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CTGATGTCTCTTGTTGCAGGACTTAGGAATGGAGCTCTTTTACTCACAGGAGGAAAGGTA 
AGTG GTTAAGGTGTGTTCATTTTTCTGTAACATTTAATAACTTTTCATTTATCTTTCTTT 
GGGTTTTGACCATCTATTATATAGGGTGGGTTTTGACCATCTATTATATAGGGTTTATAC 
GACATATGGAAAGCATTCATTTATTCACTAATATTTCTGTGTGTCTGCTTTTAGGTGTTG 
GGGGAGTGATGACGAATAAGACTGATGTTCTCCATGCCCTTTTTCTGTGTCAGTTGATAC 
AATTATATGGTTTTTCTTTTTTAGGCTATTAGGTGTTGATAGGGTTGAGTAACTTACAAA 
TGTTGAACCAGCCTTGCATACCTGTGATAAATACCACGTAGTTGTGGTGTATCATTCTTT 
CTACATTGCTGAGTTTTATCTGCTAATGTTCTGTTGAGCTTTTGTCCATTTAAGTTTGAA 
AGTGATTAGTTTGCAGTTTTCTGTTTTTGTGTTGTCTTTGTCTGGTTTTGCTATCCGTGT 
AAATCTGGCCTCATAAAATGAGATGGGAAGTATTCTCTCCTCTTCTTTTGTTTTTTTGGA 
AGAGGTTGTATAAAATTGAGGCTGAATCTTGGTGGTTGCCACAATGACAGGAACTATTTC 
TGTGACTGAATATATTGGGAATTCCTATAAAGCAATTATTTTCTAG GGAAGTGGAAAATC 
AACTTTAGCCAAAGCAATCTGTAAAGAAGCATTTGACAAACTGGATGCCCATGTGGAGAG 
AGTTGACTGTAAAGCTTTACGAG GTATGAGTATGGTAACACTCTATATAAATCCCTTTTT 
CATTAGAAAGAC AGGAATGTTATACATAATG C TGTCAAT CTAATAAATACACATAT CAT C 
TAGTCTTTAACTTTTCTGTTTATCATTTAGTCATTAAAATTTCTTTGGCTTTCTAATGTT 
TTTGATAAAATTTCTAAAACTCTCCATATTTAATGGAGGCCTATTTTTTTTTCTAGCCAG 
AACTTTTTGTAGACTACATTTCTGGAAGTGCTCACTGACACCACTCTGAAAAATTAGTAC 
TTAGAATATACTCTAATTGGTATAAATGATCTCTGAATTGCTATGGAAAACTGGGAGAAT 
GGTTGCTTCAGGGGAGAGAAAGTAGGAGGCTGTGGACAGCAATGAGGAGAATTACAGTTC 
ACCATATAACACTTTTGTACTTTTAAAGTCCTTAACATTTACATTATTATCTATTCAATT 
AAAAAATATTGGGAAGATTTTACTTTGAACAGTTAATTTTTCCCCCATGGGTACCGCTGT 
CATATAGTTCCAACTAATCATGAACTTGTGTATTTCCTGTTCTTTGTAAATTTAAACTTT 
GTAACTCACCAGGAAGTTTGAAGCCAAATTTGTGTTTCAAATATAGCAACTCCAGGATCT 
CTAGGCAGATGCATTTGCATTTGATTTTAAATGAATCTTGATCCCTTACTCTCACTTATG 
TTTTCCCACATCCTACTTTTTTTATTTTGTTGTAAGCCATCTAAAATTCTCAATGGGATG 
AAACTGGGTATAAATGAATACATGCATACAGGAATTATAGTAGCATATTCCTTTTCTTTT 
TTCTTTTTTTTTTTTTTTGAGACAGAGTCTTGCTCTGTAGCCCAGGCTGGAGTGCAGTGG 
TGCGATCTCGGCTCACTATAGCCTCCACCTCCCAGGTTCAAGCAATTCTCGTGCCTCAAC 
CTCCCGAGTAATTGGGACTACAGGTGCATGCCACCACACCTGGCTAATTTTTGTATTTTT 
TAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGATCTCAAACTCCTGACCTCAAAGT 
GATCTGCCTGCCTTGGTTTCCCAAAGTGCTGGGATTACTAGCATAAGCCACTGCACCTGG 
CCTCCTTTTCTGAGTTTTATAAAATTTGATACTTTACTGCACGCTTTGAGACTGTATTAA 
TTGAACCATGTTGATGAACAAGTTTTTGTGATGGGTATATTAATAAAATATAGATCAAAT 
TTTTATAGTTAAATCAATATCGAGCTTTTCTAGTGCTTTCAAAAGGACAACCTGAATTTT 
CCCAGCACTGAAATGATACTGAAACCATTTCATATCTTCTGTATTAAG GAAAAAGGCTTG 
AAAACATACAAAAAACCCTAGAGGTGGCTTTCTCAGAGGCAGTGTGGATGCAGCCATCTG 
TTGTCCTGCTGGATGACCTTGACCTCATTGCTGGACTGCCTGCTGTCCCGGAACATGAGC 
ACAGTCCTGATGCGGTGCAGAGCCAGCGGCTTGCTCATG GTAAATGCATCCACCACTGGC 
TTAAGGTCTTGTTCTTTTGTCAGTCAGCATTTTTAGTCTTAACAATAAATCTACTCTCTT 
CAGAGAATAATATATGTGTTATGTTAAGTGTTGTGTTTGAGGC C C CTGATGGC ATTCTAC 
AGTTGTCCTATAGACTGTAATAGCAAAATTGGTAGAGTAAAAACAGTGTGAAAATTCTGC 
AACTTCATGGTTAGTCCTTTAGGGTTTTTCATTCTCCCTTACTTATTGTTTAATTTACAG 
ATTTACTCTTTTGTTCATTTGACAAATATTTGTCAAATGCTTGTGCACAGTCTGTATTCT 
CAAATTCTAGGAGAAAAAGAAGGGTGAACAGTATTAGCGCAGAACGATACTAATAATGAT 
GGCTACTGTGTATGAGTAGCCAGCCCTTTCTTGGCTTTCTTGGATTGCTTTGTATTCTAC 
ATGAAGATATTCCCTGGGCTTTACAGGTCAATAAATGGAAATTCAGAGAGATTAATTTGA 
CCAGGGTGACCAACAAGGAGATGACAGCATACACTATGCGAGAAGTATACACAGAGTAGT 
GTAGGAGCATATAACCTAAACTGGGGGTGAGGTGGGATAAGGAGTTATCAGGGAAGGCTT 
TTTGGAGGAGTTGACAACTGAGCCGAGTTTTGATGGAAGAGTAGAAATTAGCATGAACCA 
ATTTCATGCTAATAAAGAAGCAAAGGAAGCGTGGTCTACAGGCAAAAGCACAGAGGTACA 
GGAAGTAATGATATGTTGGGGAATACCCTGTTGACTGGAGCTTAGAGTGCAAGGAGAGGA 
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GTGCTAGGGAGGTGAGGTTGGAGGGTTTGGCAGCATTGACTTGCTTCAAGGTTCTTAAGA 
GCTGAAATAGATATAAAATGCAACTAAGAGTGGCTTGGATTATTATTACCTAGTGTGTTA 
ATCTCAAATTTTGAAATCTATAGCATCTATAGGACTGGTGTTACTAATCTTACACTCGAT 
CTGTTACTGTTCTTATACTAGATCTATTAGTCCAGTGTTTAAGGGAGTGGTGCAGATTTC 
TAGGTCAGGACAGGACTCAGATGTACATTATTAATGCCTATTTCAGTTCTGACCTTCTCA 
TATGAAACCTTATAAGACCTGGGGTAGGAAGAGATTGTTCTGGAAGTCATAGGAATATGA 
ACTGTATTTTGTTTAACAAACAATACAGTATGGAAATTTATCACCCTTCCAGAATATTTA 
TTTCAGAGACAAATTTTTATCATTCGTTCATTTATTTCATAAGATCCACGAGTAGGGAAC 
CTCACTAGACATTGCTCTGAGTATATGGTCTGAGTTTGCAGTACCTCTTGTGTCTCCATT 
AGATTTATTAGGTCCTCAATAGATAAATCAGGGAATAACTAGATGGATTCATTTTTTAAA 
GACATGAAAGAGCGATACCATACATACTGCACCTTAAAGGTCAACCTTAGAGTATCATTA 
TTTTTAATGAATGTATAATTTTTAAATTTCATGTTTACTTTTCCTAAGCTTTTGCACTAT 
ATTGCTTAATTCCAG CTTTGAATGATATGATAAAAGAGTTTATCTCCATGGGAAGTTTGG 
TTGCACTGATTGCCACAAGTCAGTCTCAGCAATCTCTACATCCTTTACTTGTTTCTGCTC 
AAGGAGTTCACATATTTCAGTGCGTCCAACACATTCAGCCTCCTAATCAG GTAATACACT 
ACTTGTAAGGATTATTGAATTATGTCCCTTTTATAGAAATTATTTTTCAATTTTATTAGT 
AATTCGTGGCTTTAAATTTATGCTTCTCTTAATGATTTTAAGGATATGTAAGTCAACATT 
TGGTGCATATTGTGCTAGAGGCATAAATTATAATTTATAGCCACCTGAAATGTTAGTATG 
CGCTTTCCAAGAAAATGACTTTTTTGAAAATGGTATTTCTTTGAATGAGAAAGAACAGAG 
AGAAATAGATAGATGGCTTTTAAACACTTCATTAATTAAACTTTTTTTTTCCACCATCAC 
ATAATGGCACTTAGTCCCCTTTGGGAACTCATGAGGGTTTTAGTGGTAGTGAGCTGAAAG 
AAATATGTTCCAGGACTGGCAAACATATTCTAAATTCTTTAAAATTTTCACCTAGCATCT 
ACCCTAAATATTCAGACCCTGTGCTAGTTAACTGCTATTGAAGAACAAAGGTATTATATC 
TATTATTAAGGATAATAGAATGGTATTTGAGATATTGGTCATTGAATATGAATATGTTTT 
GAGAAATAAGTTTTATAGGAACCAAAAAAAAATTCTTAAAGGAACCATATATTACTAAAA 
ATGCTTCTTATTGGAGAAAGAAATGACAATCATTTATTAATGTGATTTTTTCACAACTTT 
ATTAAGATATAATTTAAGTACAACAAACTCACATAAAGTGTACAATTTGATCAGTTTTAA 
CATATGTAGATGCCATGAAACCATCACCACAATTAAGGAAACAAACATTTTCATCACTCC 
AGAAGTCTCCTAGCCCTTTTACTACCCATTCCTCCCCTGCTCCATCCCCAGACAACTACC 
AATTTGCTTTCTGTCACTATAGATTTGTCAACCTGATTTTCTCCAAATATACATTCAAAA 
ATATACAGTTGAATACAATTGGAAATTCGAATTTTGTGTTTTTTTCTTTAG GAACAAAGA 
TGTGAAATTCTGTGTAATGTAATAAAAAATAAATTGGACTGTGATATAAACAAGTTCACC 
GATCTTGACCTGCAGCATGTAGCTAAAGAAACTGGCGGGTTTGTGGCTAGAGATTTTACA 
GTACTTGTGGATCGAGCCATACATTCTCGACTCTCTCGTCAGAGTATATCCACCAGAGAA 
AGTATGTTTTACTATTAAAACCTGAACTTGGAATCTTCTTTCTATTGTGGAGAAATGTAA 
TTGTAGTAAGACAAGAATTAAATATATTCCATTGTAGTATTTGAATAAGCAGTTATTTGA 
GTAGAAAATTAGTGTTTCCAGCTAAGATGATGGCATATTTTGAAAATTCATATAGTGAAT 
ATAACTAGTAAAAGAAGTTTTGTTTATTTTTAAACAG AATTAGTTTTAACAACATTGGAC 
TTCCAAAAGGCTCTCCGCGGATTTCTTCCTGCGTCTTTGCGAAGTGTCAACCTGCATAAA 
CCTAGAGACCTGGGTTGGGACAAGATTGGTGGGTTACATGAAGTTAGGCAGATACTCATG 
GATACTATCCAGTTACCTGCCAAG GTATGTTTAAAAAAAGAAAAAGTGAATACTTACTCC 
CAGAAGAACCACTGTATTATTGGCTTTGGCTTTATGTGTCAGCTTGCCCAATCTCCGTGT 
GAGTCAACAAGTGTTTACTGAGTTACCAAATAAATGTCTTAACACTATTTTAGGTACTTT 
AACAAATTTTAATTTTATTAATTAATTTTTTATTAGAATTGAGACCTCACTCTGTCATCT 
AGGCTGGAGTACACTCACAGCTCACTGCAACCTCAAACTCCTGGGCTCAAGCAATCCTCC 
TGCCTCAGCCTCCCCAGTAGCTAGAACTACAGGCATGAACCACCATGCCCGGCCAACTCT 
TTAATTTTCTTAGAGACGGAGTCTTGCTATGTTGCCCAGGCAGACAGATTTTAATGTGTA 
TGATGCAGTCTTTGATGATAAGAAACTTATAATGGAAAGCTGAGGTGATAGTTACAGTAA 
ATACATTTTGATGTATAATTCTGTTTGCTTTAATCATTCAAATTGTAGTAAAGCAAGATG 
AACTGTCTGCTGGGATTTGAGCAGAAATGGATAGGAATAAACTAGGAGGTAGAAGAGTTA 
TCAAGGTTCACAGGACTGATGGGTGAAGCTAGATTTCCAGACCCGGGATGTCAGTCCTTG 
AAAAGCAGACTTGGCAGGCATAGACGAGGCAGATAGCAGGATAAAGGAGACAAATGTAGA 
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TTGTTCTTCAGAAGATCAGATGGTAGAGTCTAGGAGGTAGTGTGTTTTAATCAGAGATCT 
GAGAGGCAAAGATCATTGCATGAGATCAGGGACCCATGCAAAGGAGTGAGAAAAAAAACT 
GGGTTAAGGAGCCTGCTGCATGGCAACTCCTGGGAACAGTGGCCACTGGGGCCTGGGACA 
TGTTGATTGCAGCCCAGGACTGTTAAAACCAGTGTGAGAGAACATGGGTATGGAAGTACT 
AGCTAGCAGGATCATGACCCCGATGCTGGGATGGGGCATCAAGCATTAGTACATGGAGAT 
TCAGTACATCCAGATGCAGTACATGGAGACTATATGCGTAACTGCTGACTTTGGGCTTCT 
TTCAGATTGGAGCAGAGGTAGAGGTGAGTGGGAATATTCTCAATAGAGGGAACTAAATAG 
GCATACCTAATAAAGGAGACCAGGATATTGCAGACAGTAGCCTCATGTTTGGCTCACCTG 
TTCAAAAAGTTCTCTTGTTCTTGAGCAGTGGTGCCTTAAAAGGTAACTTGAGAAGCAGTC 
GATTATTTGTTCAGCCTGGAGACTCTTGGGATATTTTACTATCTTTGATTGAATAGATTT 
AAATGTACACAGCTCTCATAACTTGCCCCATGAAGCATATCCATGAAAGGCACTATACTT 
GTTAAAAGATTGGTTTGTACTTTTTAAATGTAGTACTTTTAATAAAACAGGAAAAATAGA 
AGTTCTGATGCAGTTATATGCATTTTATATAGAATGTGTTCTTAATTGGAAAAAATTTGT 
CGTAGTTCCTTTGAGTTCATTTACAGTTTTTAGTAGGAATTGTATTTTCTACTGTTGTAC 
TTGCTGTTACTAAAGAAAGATGGTCGTGATTACCATCTGAATTTTTTTTCTATACATTGA 
TCTTTAGCTGCTACTTAGTCATTTCTGTTTAGACTTGAGCTCTTTTTCATATTTTTTTTT 
TTTGTTTCTCAG TATCCAGAATTATTTGCAAACTTGCCCATACGACAAAGAACAGGAATA 
CTGTTGTATGGTCCGCCTGGAACAGGAAAAACCTTACTAGCTGGGGTAATTGCACGAGAG 
AGTAGAATGAATTTTATAAGTGTCAAG GTATGTTGTCTACTTATCTTCTTTTTTTATTTA 
GGTAAAATTAACATAAATGCAGTTAGCCATTTCAAAGTGTAAATTCACTGGCATTTAGTG 
CATTCACAATGCTATGCAACCACCACCTCTCTCTAATTTCAAAACTTTTTCATTCCACTC 
CTCCTCTTGCTTATCCCCTGGCAACCATTCATCTGCTTTTTGTCTCTATGGATTTGCCTT 
TTCTGTATATTTCATATAAAACAAATCATGCAATATGTGACCTTTTTTGTCTGGCTTCTT 
TCACTTATGTAATGTTTTCATGGTTCATCCAGGTAGTAGCATGTATCAGTACTTCATTCC 
TTTGCATGACTGAATAATGTTACCATACTTTGTTTATCCACTTATCAGTGGTGAACATTT 
GAATTGTTTCTACCTTTTGACTATTATGAATAATGTTGCTGTAAATATTCATGCACAAAT 
TTCTCCACGGATATGTTTTCATTTCTCTTGGGTATAAACTGAGGAGTAGAATTCTTGGGT 
CTTAGGGTAATTCTCTAACTTTTCAAAGAACCACCAAACTGTCTTTCACACCAACTGCAC 
CATTCCCACTAGCAGTGTGGGGGGTTCCTGATTCTCCACATCTTTACCAACACCATTATG 
TTTCTCAATTGTGGGCTAGTCTCACATTTGGAAAGCTAGTGGGAGCAGCGATCCATCTAT 
TAAAAGTTGTATGAAATTGAGTAATGAGCCACCTCTCTCTTGTAGGGCTTATTATGTTCT 
TGCTTAAGGCAATCTTCATGCATTGTGAACAGAATTATACATAAATGCTCAGATAAAAGG 
GC AAAC C ATT CT TAAAGGGAGTAGAC AACTAGAGG C AGGAGACCAT AC TGAGGCAGGAAG 
CTGGGGTTTTTATGGTTCTGTTACTTTTGACTATATCTCACCATTGCTTTTGTCAAAGTG 
AGACTAGGTCTAAGTTTTTTTCAGGTATAAGGTGAGTGTGGTAATTAAGGGGCATGCTAG 
CAGATCATTTTGGGTAATGCTTCACAGTCCACCACTGGTGTGTCATTGTGGTCGCAGATC 
CAGTATCTTAGCTGTGTAATTTCAGACATCAGCAATATTAGTTTAACAAAGGGCAATTAG 
ATTCCAAGACAAAGGAATCGTGTATTATTCTAGCCTTATTCAAACTTGATTTATAAATCA 
GTTTAGTAATTTATTTATTTGTTTCTGTATTTATTTTTATTTCTTTGAGATGGAGTCTCA 
CTCTATTGGCCAGGCTGGAGTGTAGTGATGCAATCTTGGCTTACTGCAACCTCTGCCTCC 
TGGGTTCAAGCTATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGGATTACAGGCTAATTTT 
TGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTTGAACTCCTGAC 
CTCGAGTGATCTGCCCGCCTTGGCCTCCCAAAGTTCTGGGATTACAGACGTGAGCTACCG 
TGCCCAGCTCAGTTTAGTAATGTATAACTGGGTTTTACCCAGTTGTAAATTACTCTTTTG 
TCGTGTTTTTTTGAGAACTGGCAATGACGGAGAAACTAAAAGTGCCAGGCTGTTGCCTTG 
TTCCTGTTATTTTGCCTTAGTTTTTTTTTTTTTTTTTTTTTTCTCTGAGACTGAGTCTTG 
TTGTGTTACCAGGCTAGAGTGGAGTGGCATGATCTCGGCTCACTGCAACCTCTGCCTCCT 
GGGTTCAAGTGATTCCTGCCTCAGCCTCCCGAGTAGCTGGGATTACAGGCGCCTGCCACC 
GCACCCGGTGAATTTTTGTATTTTTAGTAGAGACGGGATTTTACCATGTTGGCCAGGCTG 
GCCTCGACCTCCTGACCTCATGATCCACCAGCTTCGGCCTCCCAAAGTGCTGGGATTACA 
GGCGAGAACCACCGTGCCCGGTCTTGCCTTAGTTATTTCTTGTTCCCTCCTCTAGTCCTA 
TAGTTCTCTGACTGTATTGAGGAAATGTAATTAAATATTATTATGTTAATAGATATTTAT 
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GTGGTTGAATATTAGAAATTCCTTATTTTGGTCACATATCCTGATCAGTAGTTGGTCTTC 
TGGAGATAGTGATTTTTCACTAGAGATGACTTTAGGACCTATTCAGGTTTTTTTTAAGAT 
CCCAATTTAAGGAAAGACTATTCTCATTATTGATTTTGCTATATGCAGGGAAATTTATTT 
CGAAAGGTTTTTCAGTTGGCTTTTAGGGAAGATTATATATTCTCTTTTTTTTTTTTTGGC 
CTTTTCCCACATGTTCTAAAAATGATATATTCTTTAACTCCTATGAAAATACATTGTTTC 
AGTAATTGAAGATGCTGATTAAAGTCATATCTCTACACATTTTTTAAAATTTGAGATAGA 
TGGGACTTTGTCCCTTCTTACACCATTCACTTATTCACTTGGAAAAACTATTATCCAATA 
CTTATGTGGCAGACACTGTTTCTGGCACAAGGGATTCAGCAGTGAACAAAACTGCCTTTT 
TGGAGTTTACATTCTACTAGTGGAAAGCGACAACAAGCAGATAGACACATTCAGTATATA 
ATTCACTGTCAGATGGTGGTGGTAAGTCCTATGTAGGAAGAAAAGCAGGGTAAGGAGGCT 
TGGAGTAACTGGAGTGAGTCATAGATGGACTTGTCAGGAAAGGGTTTCTGAAGAGGTGGT 
ATTTGGG C AGAGAT CTAAATAAAATGAAGCAACAAG C C ATGAGAAT AT C C GGGGGAAAAT 
GTTCTGGGCAGAAGCATCAAGCATAGAACTTGTGGTATGATATTTATTCTAGCACACATT 
AATTTTAAAAATGTATAAAAGACATCCATTTAATCATATTAAAGATTTCCATGATTCATT 
TAGACTTAGTCAGAAACCAAATTTATATTTTCTTTTTAAATAATTTTATCTCAACTCTTA 
TTTTACCCAATAG GGGCCAGAGTTACTCAGCAAATACATTGGAGCAAGTGAACAAGCTGT 
TCGGGATATTTTTATTAG GTTGGTAGCCTATGAATGTTTTTAAAGTAACTGACTCTGTTA 
TTATTTATCAATCAGTGCTTTTTTTGGTCTTGTTTTTTGAAGAACTGATATTTGAAACCT 
GTGGTTTATGTGAATTATTAATAAGCTAGAGGACGTGGATTCTCTATTTCATCAAATAAT 
ACAAAACATTTTAGATATTAAATTTTGGAAATTATTTGGTTTTGTTTTACAATAGAAATA 
CTCCTCAAAGTGGAATCGAAGTGGTTATTCAAAGAAATCTCAGAGTAGATTCTTATATGA 
AGCAAATAATTGCCCCTAATTTATCTCTAAATTTTGTAAGTTCTAAATTCTTTTTTCCCC 
CAGTTTCTAATTTATCTCTTATAAGTCAAGAGTCCATCTGGCCAATTTAATTTCAGTGAG 
TGTAACTATTTTGCATATATTAAAAAACTGTATATGAATACAGAAGATGGTATTTAAGGA 
TGAAAATAATTATTCAAATGTGATAGCATTATGGGGAGTTTTAAAATAAAAGTTACTGTT 
TTATTCTTCCAAAAATTTTATTATAAAGTATACAGTTAAGAGAATATACATAAAATACAT 
ATGCAGCTTAAGGAAGAATAATAAAATGAATACTTCATGTATTCACCACCGAGTTTACCA 
GGAAAAAGCATAAACAAAATAAACCTCTTCCACGTAATTCCTGGGTTAAAGAGAAGTTAT 
AGTGGAAAATATTTGGGAGCAAACGATAATGAAAATACTATCCATTAAAATTGTTAGATG 
TTGCAAAACTGATTTCAAGGAAAATTTATAGTGTTAAATGTTTAGAAAAGAAAAAAGGTT 
AGAAGTTAACCACTTATGTATCTATCTCATGAAATTAGGAAAATTATAGATATAAACTAA 
AAAATATGTTAAAAGGGAAATAATAAAGATAAGAATGAAGTTTAATGAAACACAAAACAG 
AGAAGCTCACAAAGCCAAGATTTATTTTTTGAACACCGAGTACAATTGACAAATCTCTAA 
CAAGTTTGATTAAGAAAAAAGAAAGCATGAATAAACAATTTTAGGGATAAAAAGGGAAAC 
ATCGCTAAAGATATCCCAGAAATGTAAAAGATAATAAGGGAATATTATGAAAATATTCAT 
GCCAATACATTTGAAAACTTAGGTGACATAGACAAAAACAAAATTGACCAAAATTGAGCA 
AAAAAGAAACAAAATCTGAGTAGTCCTGTAACTTAGTAAAAATTGAGTTAGAAAAGTTAA 
AGAAGTCTTTACACAAATCAAACATCAGACTCAGTTTTCTAGGAGAGTTTTGCCAAACAT 
TCAAGTAGCAGATAATTCTGGTCTATTTTTGGCCCCAGAAGATATATTTTACTTGCCATG 
CATTTAATGAGATAGCTGTTGATTTTTTTCAATCACCGTGACAGGTGTTTTATATTAGGT 
GTTATTCGCCAGACATCTAGTCCACCTGTTGCCAGATATGGAATTAATATTCACTTATTT 
TGAATTAAAATTTGTTAATAAATTAATAAAACAAAGTCAAAGTTCAAATTATTAAAAAAG 
TAAAAGAAATAAAATATATTTTATAGAGAGC C CTTACAAAACAGTAC C AAC ATAAT GAG C 
TTTCCAAATTTTGAATGGGCAAAATAAATGAATAGGCATTTCACAAAAGAAGGAAGGGTG 
GCCAATAAGTATATATTAATATAAAAATGGTTACTTGTAATAGGAATCAAAAGTGTTTGA 
CTTATTGACTAAGAGTCAGTTTTTGTTTTGATCCCTGTTAGTCTATCCAGAAGGCATGGG 
TCTTAATAAACACCTTGACCTCAACAGTTTACTGAATACAAGGGTAATTTCATATGCCTT 
GCCTTCTTTAAGGGTTTGTTGTAAAGATTAAAATAAATACATAAATATATATAAATACAT 
TTATATGTATTTATATGTAATTACATACAACTTGCCTTCTTTAAGGGTTTGTTGTAAAAA 
TTAAAAGAAGT AT ATAAATAT ATATAAATAC ATAAAAT AAAT ACAT T C ATATATGT AT AT 
GAAATCACTTTGCCAACTATGAAGCCTGATTCAAATATGAAATGTTGTTTGTTTTTCCCA 
G AGCACAGGCTGCAAAGCCCTGCATTCTTTTCTTTGATGAATTTGAATCCATTGCTCCTC 
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GGCGGGGTCATGATAATACAGGAGTTACAGACCGAGTAGTTAACCAGTTGCTGACTCAGT 
TGGATGGAGTAGAAGGCTTACAGG GTAATAATTATAAATACAGAAATAGAATGTTATAAC 
AAAATGTCATCATGTCATCAGATTTTGGTAAAAAAATGTTCTTTTTTCCTCTAGGTGTTT 
ATGTATTGGCTGCTACTAGTCGCCCTGACTTGATTGACCCTGCCCTGCTTAGGCCTGGTC 
GACTAGATAAATGTGTATACTGTCCTCCTCCTGATCAG GTGACAATTTCATATTTAGAGT 
CCAAAACCCAACAAATGCTACACTCTTTCCTTGTGAGCTTTACTTCTGCCAGGTAATGGC 
AATTGTCCTTAGAAGACCAGCTTTCTTAGGGAAAAGCTTTAGCCACTGTTTGCTCAAAGC 
ATAAAAAGATTCTGAATTAGATGCAAAGCCTTTTTTTGGCCCAGTGCAAGTCTGAAAACT 
TTGTAATCCTTCTGTGTTGGCTGATTGGGGAAAAAAAAATGCAAGAAACCTAATGTATTA 
TATTTTCACATTATCTTCTGTTCAAAGATTACATACTTCCATTATCCTGTCAAAAAAAAA 
ACTCTGATACAGAATCAAGCATGTGAATCGTAAGCATGTAAGCAGGTTTCATAGAGATAA 
TTTTTCAACTCTTCCTTGTCCTGTGTTGTTCCAACTCTTATTCTCCAATTTAGAAGCAAA 
CAAATAAATGAATGAAAGAACAGATAGACAAATGAATAGTCAAAGGTATAAAGTATCTGT 
ATATATGTTACATGTAGCTATTATTTAAATTATTTAGATTTTCCTTTTGAAATACCTTCT 
TGGCACACTTGCCTAAATCTAGAAAATAAGCACTGTGTGAATAAGAAATTATTTACACTG 
AATATTTTGTAGGTTTTTGGGTTTTTGTTTTTCAGACAAGGTCTCACTTTGTCACCCAGG 
CTGGAGTACACTGGTACGATCACAACTCACTGCAGCCTCTATGGCCCAGGCTCAAGCAAT 
CTCCCCACCTCAGCCTCCCGAGTAGCTGGGACCACAGGCACACGCTACCATGCCCAGATA 
ATTTTATTATTAATTTTTGTATAGAGATGGGGTCTCCCTGTGTTGCCCAGGCTTTCTTGA 
ACTCCAGGGCTCAAGTGATCCTCCCACCTCAACCTCCCAAAGTGTTGGGATTACAGGCGT 
GAGCCACCATGCCCAGCCTTAAGAGTGTTTGATTTTCATTCATTTTCCTATATATATTAT 
TTCTGTTGGGGAAAAAATTCCAAGGAAGATAAATAGTAGGCTGTTGGTACATTTCTCAAC 
TTACTTATAAAGCTTTTTAGATATATAAGGTTAATTTATGAAGAAAATCATAAGATACAC 
AATTTAAGATAATATTTTTAATTTTATTTTTTATTTGTTAAATAAATTTTTCTCCTTTCA 
G GTGTCACGTCTTGAAATTTTAAATGTCCTCAGTGACTCTCTACCTCTGGCAGATGATGT 
TGACCTTCAGCATGTAGCATCAGTAACTGACTCCTTTACTGGAGCTGATCTGAAAGCTTT 
ACTTTACAATGCCCAATTGGAGGCCTTACATGGAATGCTGCTCTCGAGTGGACTCCAGGC 
AAGTTATATGAGGAAGTTGTTATGACATTTTATGAGTGATAAAAGAAGTACAATGTCAAA 
ATTTCCACCTTAAAAAATGCTATTTTTTAAACAACTTTGGTAAAACTGTATAGAAACATA 
AATTTACCTTTAGTTGAATGTTCCATAGTTGGAATATGGGTTTTGCAGAGAATTTATAAT 
TATGAAGTTTGATGTCTGTTTCTTTAACATTACCTTAATATTGGCAAAAACATGTTGGTG 
TTTGCAAGGATATTATTTAAATTGGGATACCATGAATTAAATACTACAAACAAAAATAAT 
TAGAGTTTTTTGTTTGTTTGTACTTTAACTTTTAAAAAATAATCAGTTAAAGTTGTTGTT 
TTGAAGCTCACATTGTTCCAATCTGGCCAATAGGAGCCCCTTTTGTATGGCTCCTGTATC 
TTTATGACATGTCCTCATCATTCTTGAATCACTTCCTCACTTCCAGATACAGTAAGTTAT 
TCTTGGCCAGGTGCAGTGGTTCACGCCTGTAATCCCAGCACTTTGGCAGGCCAAGGCAGG 
AGGATCATTTGGGCCTAGTTTGAGACCAAATCATGGTTGCACAAACTGTACCCACTATGG 
ACAACAGAGTGGGATCTTGTCTCTGTGAAAAATTTAAAAATTAGCTGGGCATGGTGGCAC 
ATACCTGTAGTCCTAGCTTCTTGGGAGAGGCTGTGGCAGGAGGATCGCTTGAGTAAATCC 
AGGATGCAGTGAGCCATGCTTGTGCCACTGCACTCCAGCATGGATGACAGAATGAGACCC 
TGCCCCCAAAAAAGAAAAATATTCTTGGTTTATCTTGTACTTTCTGTATCCCAGCCCTAG 
CATCAGCCTTTTCTCTAAAGACAGTATTATGATTTTAATATTTACAGTAGATATTTGAAC 
TGTTACATTATAGACTTTACCATATATTTTCTAGGAAGGATTATTCTATTACTCTTCTTT 
ACCACATTTGTTTGGAATGTCTACAGAACCTACAGTTTCTAAATCAGAAACTCCCTAGGT 
TTTTGCTATTTTGGCAAGCCATTGAAGTTCTTCCCTCTCCCTTTACTACCAGAAAGGTGT 
GTATTTGTAGAGCTCTCTATAATGAGAAAGCACTCTATAACATGGTTGATTCATCATTTT 
GG AGTAG AAAAG T ATG AATGG AAAGT C AG AG AC AT AAAAAT AAAG C C C AG AGGT C TG AGT 
CTTAGCTTCATTACAGACTTTCTTGGGGGATGGTTGGTAAATTATCTACACATTCTATCT 
TGTCTTTATAATTTTAATAGTTAAATTTTTACCATGTGCCTCAAAACCGTTAGAGAATTA 
ATGAGCTCTTTGAAAAATGCTTCTAAGTTTCTTGTATTGCTCTAATAGAATGCTATCTAT 
GTTATTATTTATTTCTGAGACTAAAATTGTTTACATCTTTAAACTGGTTGTCCTTTTGTG 
TATTTTAG GATGGAAGTTCCAGCTCTGATAGTGACCTAAGTCTGTCTTCAATGGTCTTTC 
TTAACCATAGCAGTGGCTCTGACGATTCAGCTGGAGATGGAGAATGTGGCTTAGATCAGT 
CCCTTGTTTCTTTAGAGATGTCCGAGATCCTTCCAGATGAATCAAAATTCAATATGTACC 
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GGCTCTACTTTGGAAGCTCTTATGAATCAGAACTTGGAAATGGAACCTCTTCTGATTTG G 
TATCTTGTGCAGTCATCATTATACAGTTCTGAAATATAAAGCTATATGTTGGTGTAAAGT 
TGCAGTGATTTCTCTCCTAACCAGCCCCACATATTCTTCCTGGTTGGTTGGTTCTTCAGT 
AAAATAGTCTTGTTTCTTGCTTACACTAATTGGTAATTTGCATTCCTTGTTAAGATTTTC 
AAGACAGGGCTGGGAGCAAGGAACCAAAGTAGCGCGTGGTTGTGATTACCTTTGGTTTCT 
TTGAGGTTTCTCTTACCTAGTGGCTTTAAAACATCTTTAGGAGCAGTTCCATTTTATAGT 
AAACTTAAATTCTGTTATCATGAACAGTTGAGGATAATGAATAATTTGATACAATAATGT 
AAGAAATTCCTGAAAACAAAGTGTTATCTGTGATACTTTTGCTGCATAGTAAGCACAATG 
AAGTGTACTGATAATGTTTCAACAGGAAAGTGTTTTGATTAAATGTGGGCAGTATCACTG 
TTCTACTAGCATTCAACATCTCTTCTAAAAATTAATAGTGGTTCACTGTAATTTTATTGG 
TACATGTAACATCTGTACATGTGTTTGGTTATCTATATGTTTCCTGGTTTTTTGTACATT 
TGCTTTATTAATTTAGGCTTTTTTTTTTTTTTTTTTTTGAGACAGTCTCACTCTATCATC 
CAGACTAGAGTGCAGTGGCACAATTATGGCTCACTGCAGCCTTGACCTCCTGGGCTTAGG 
TGATTCTTCCACCTCAGCCTCCTGAGTAGCTGGGACTACAGGCACATGCCACCATGCCCA 
GCTAATTTTTGTATGTTTTGTAGAGACGAGGTTTCACCATATTGCCCAGGCTGGTCTCAA 
ACTCCTGGGCTCAAGCTATCTGCGTGCCTTGACCTCCCAAAGTGCTAGGATTACAGGTGT 
GAGCCACTATGCCTAGCCTAACTCAGACTTTAAAAATATAAAAGCAATTCATTTTTATTC 
CCAAGAACAGTAAGGTGGTGGTTTAATTTTAGTCTTTAATTCTGTTTTTAATTTATTCTA 
TTTAGAAATGTCCCAGAAACTTAGTATAACTTTACTTTCTGAAAATGAAGAAACCTGTCC 
TTGGGCATTAGTGTGTTGGATTTAAGCAACAAAGTTAAAAAAACCTACCCTGTGTTATGG 
CAATTTTCACTTGATGGTGGTTCTATAACACAGGTATCAGTGAACCTTTATAAAAGATGA 
ACAACTTTTCAGCTTGCTTAATTTCAGTTAATTAACATGTATACTTATCTATGTTAATGT 
TTTATTGCTTAAAATGTTTAATTTTTATATTTGGTAAACAGATAGTTTTTTCTCTCCCCC 
TCTTCCTTCCATCTTTCATTACTACAATTTACCATGCAG AGCTCACAATGTCTCTCTGCA 
CCAAGCTCCATGACTCAGGATTTGCCTGGAGTTCCTGGGAAAGACCAGTTGTTTTCACAG 
CCTCCAGTGTTAAGGACAGCTTCACAAGAGGGTTGCCAAGAACTTACACAAGAACAAAGA 
GATCAACTGAGGGCAGATATCAGTATTATCAAAGGCAGATACCGGAGCCAAAGTGGA GTA 
TGGCTTTTTCCCCCTCATTATAATTGTTAAAACTTCTTAAAAATTGTTTCACCCTTTTGA 
TATATATTTCTTTGACTTATAAACGAGCTATATTTATAAACAAGGGACCAGAACACATTA 
ACTCAGTCATGGTTATGTGCTTCCTTGCTTTCAATGTTTCATTATCTTATAAGGAAGAGA 
ACGTATGGTCTCTTGAAAAAACTGACAATAAGAAGTAACAACTGGACTACCACATTTTTT 
TTTACATCCTTAATTTAACTCTTCGTCAATTTCTTTTTTTACTTAAG GAGGACGAATCCA 
TGAACCAACCAGGACCAATCAAAACCAGACTGGCTATTAGTCAGTCACATTTAATGACTG 
CACTTGGTCACACAAGACCATCCATTAGTGAAGATGACTGGAAGAATTTTGCTGAGCT GT 
AAGTAACAGATTCTGTTTTGGAAGTACAGCTACTATTACAAGTGACATAGTATTACACTT 
AAACCTTTAAAGTTCGTGTTTAAAATAAAAATATTTTGAATATTTAAAAGCTAATTCAAA 
AAATATGTGTCGTAGCTATGCATTAAAAAACCCCAAAATGTCAGAAGTACAGAAGTCAAA 
ATTGAGTTTTCATTAACCAGTTCATTTGATTATATTTGAATTATTCATAATGGACTCATT 
TAATTTTAGTAACTTTGGGCTGGGTGCTGTGGCTCATGCCTGTAATCCCAGCTCTTTGGG 
AGGCCAAGGCAGGTGGATCACCTGAGGTCAGGAGTTCGAGGCAAGCCTAACCAACACGGG 
GAAACCCCATCTCTACTAAAAATACAAAAATTAGCCAGGTGTGGTGGCATGTGCCTGTAG 
TCCCAGCTACTTGGGAGGCTGAGACAGGAGAATTGCTTGAACCCAGGAGGTGGAGGTTGC 
AGTGAGCCGAGATTGCACCACTGCACTCCATCCAGCCTGGGCCACAGAGCGAGACTGTGT 
CTCAAAAAAAAAAAAAAAAAATTTAGTAACTTCGAAGAAATAAGAAGGAAAATTAAAAGT 
TGAAAGTGATTCTAATGTATAGTTTATAAAATTTTGTTATAAAAATACCTGTTTTGCCTT 
CAAAATAATTTATATTAATATTTTATTGACCTCAAGAACATTTAAATACATTCAGATTTA 
TTCATTTGTGGACCACATTTGTTATACATTGGATTTAAAGGATCCTTGCAATTGAGTTTA 
TGGCCACCTATGCATCTGAGACCCATGGACTGGGAACCATTCTAGGTCAATGATTCAGTG 
TGATTCAATTTAAGAGATGTTTATTCCTGGTCTTTAGAAGCTGCTACCTTTTGTTATCTA 
ATTTTGCAGTACTTTGAAGTATGTATGTATGTGTACATACGTTAGTGCTATGTATTTATT 
AAAGAAGAATCAGAAAACAGAGGTAAGGAAAAATAAGGAAACAAATTTCTGTTAAGCCCA 
CCACCTCCCAAAGCATATTTGTTTATATGCTTATATATGTTTTCCTATTATGGTAAGAAC 
AGTCTGTACATATTGCTATATAGCAGTCCCCCTTTATCCACATACATCCTGAAAATTGTT 
TTACATTTTAAATGTTAACTACTTTATTGTTTTTAAATGTCATTTTATAGTGTAGCTATG 
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CCACAATATCCAATTTTTAGACATTTAAATTGCTCCCAGGCAATGTGGTAATGAACATTC 
TTGCAGCTGAATATATGCACATATCTAATTGTTTCACTAGGATAGAGGTGGAATTGTATA 
ACAGGGAGCTCACATTTTTTAAGGCTTTTGAAATGTATTGCCAAATTGCCTGCCAGATAT 
ACTGCACCATCACTAACATTGTGTGTTGCAGTATTTTTCTAAACTTGGCCCTTTTGATTT 
TAGAAAAATGATATCAATAATTTACATTTCTTTGATTAAAGTGTAGAAGTTATAATTTTT 
CATATTATTCATTGTCATTTGTATTTTATCTTTTCTAACTTGTCTCTTCATCCCCTTTGC 
TCCGTTTTCTATTGGAGTGCAACTTTATTTGTAAGAATTCTTTTTAATTTCTGTGACTGG 
AATTTTTTTTTCTAGTTTGTTATTTCCCGTTCATTTCTTAAAATATAATTGTGTTTGCCA 
ACAATCCATTATCTTTTGTTTTGTAATGGTAGTATTTATACATATTAAATTATCTCTTTC 
TTTTTTCAGATATGAAAGCTTTCAAAATCCAAAGAGGAGAAAAAATCAAAGTGGAACAAT 



GTTTCGACCTGGACAGAAAGTAACTTTAGCATAAAATATACTTCTTTTTGATTTGGTTCT 




TTCTTCTTAATTTAACAAATTTGGTTAATTTATAAAATCACAGATTGGTAAATGCTATAA 
TTATGTAATGATCAGGATTGAGATTAATACTGTAGTATAAATTGGGACATTATAACAGAT 
TCCATATTTTATTTCCTAAAATCTAAATTCAGTCTTTAATGAAATAATATTAGCCAAATG 
GTGGAACTAATTTATTTCTTTTGAGGAAAAGATAATAAAGAATGTAATTAAATTTAAATT 
TCTTGGAATTCCCAGTTGTATATTCATCACCTTTGTAGCATTTGACAAATTTTATGCTTA 
GCAGCTTCTTCACTGTTTTGAAATAAAATATCCTATTACCTACTGA TACAATTATCTGTT 
CTTTGTATATCAAAAAATGTGAAATTTACACATAATTCAAATACATTTAATTATCCGCTC 
AAC C AGAAAT G AAAT C AC AT C C C T C TAG TAT ACT AC AT C C AG C T C C AAGC C C AAG AT AT T 
TAAATGACATCCATTCCTCTCCTAGTTCCAGTTATGATTTTATCTTGATATTCTCTCATA 
TATGAAC TAAATTATAAAGTTAGC CAC CAT C AATAC AAT CT G CGTATCTAAT AT C TT AAC 
TATATAGTAATGGGGTAAGGGAACAGCAAAAAGGAGAACATTAATTAAAATATACAAGTA 
AGCCTGGGCAACATAGTGAGACCCCATCTCTTAAAAAAAAAATTAGCCATGCATGATGGT 
ATGCCTCTAGTCCCAGCTACTTGGGAGGCTGAGGTAGGAGGATCACTTGCTCCCAGGAGG 
TTCAAGGTTCTAAACCAGCAAAGCTCAGAATCCCAGGGGATAGAAACAAAGACTTAGTGG 
ATCACTAGTATTAAACTGAGACACGTCACCCTGCATTGCACTTTGTTTCTCAGTTCTTTG 
ATGAAATCACTGAGCTGACATACCTGCCCTCTTTTCACCATAAAGTGAGTTTCATGATCA 
GAAGCAATGTCTATGGGATAGCCTAACAAACAATGTAAAAACCATTTAGTAAGTTCATGA 
AGGGTGGTGGTGGTAAAAATTTGGAGAACATACAAAACAAATACAATTCCAAGGTGTGTC 
CCCTCCAGGAAGGACAAATTGCTGCCTGCTCTGTGATAGAAGAGGATCAGATGTAATCAA 
CCTGCCGTCAGACTTGGGCTGTTCTCTCCTGGGTGTGGACTTGCCTGGTTGGTCACTGCT 
GCTGACAAGTAGGCTGTCAATATAGCTGGGTTGTCATGTCAGCTGTGGTGAGGGGGAAGT 
CCACATTGTGGAGGCCACATCCCTGCACTCTTGGCCAATTTGACCATGAATCTTAAGCAC 
TGGGGTGGCTGGAAAAGACAGCCGATTGACATCCATACAGAGGTCATCTTGACCACTTGA 
TTAGTATAAGCACTGAAGGCTTTTAACTGAGCATTCACATAGGACACAAATATTCTGATT 
CTTTGGGCCCATTCCAAGAACTCTGGGCATACTTTTCCTCCAGACCTCATACCCAGTTGT 
GTTCTTTCCAAATTTCTGGTCATCTGGTTATGTTATTAGCCACTATCTGTGAATCAGCAT 
AGATTTTTATATCAGACATCTCTACCTCCTGACAGAATGGAGGAGATATGTTACTTAACA 
ATTCTGTTCCCTTGGAAGATTTCCTGTCTCCACTGTTTGTAAGGGCTACTCCCTCAATGT 
AGCAGTAATGCTTTCACTCTGATGGGAAGTCACAGTGGAATTCTGGGTCTCCAAGAATTA 
GTGTTAGTGCATACACAGTGTCTGATAATCCCCAGAGTGTCTGGTGCCCTTGGATCCTGT 
GAAGAAGGCTTGGAGAAAAGAAGATTCATGGCAAGAACTTGTGATGTGATGACAGGGCCT 
TTTCTCTGGCTCTTCATTCTTAGTCTGACCTAGGTGTGAGAATTAGGTCAGGGGCCATGA 
CTATATTGTGGTGACTCAAACCAGGCCTTTGTTTACTAACTGGGAGATTTTTACATTGTA 
AGAATCAAGTAGGATCTTTGCCCATGTATTTTGGTCTTAAGAACACAAATGATATGGCTC 
CAATGACTGGAGGAACACCAGGGTCCTTGGTCTCACGCTGATTTAGATAAAACGAC TGTC 
AGGCCTCTGAGCCCAAGCTAAGCCATCCTCCCCTGTGACCTGCACGTATACATCCAGATG 
GCCTGAAGTAACCAAAGAATCACAAAAGCAGTGAAAATGGCCTGTTCCTGCCTTAACTGA 
TGACATTCCACCATTGTGATTTGTTCCTGCCCCATCTTAACTGAGCGATTAACCTTGTGA 
AATTCCTTCTCCTGGCTCAAAACCTCCCCCACTGAGCACCTTGTGACCCCCGCCCCTGCC 
CCTAAGAGAAAACCCCCTTTGATTATAATTTTCCACTACCCACCCAAATCCTATAAAATG 
GCCCCACCCCTATCTCCCTTCGCTGACTCCTTTTTCGGACTCAGCCCGCCTGCACCCAGG 
TG AAATAAA CAGCCTTGTTGCTCACACAAAGCCTGTTTGGTGGACTCTCTTCACACGGAC 
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AAGCTTTAGTAGAGATCTCAAAAATGGTTGGATGGTAGCAAATTACTAAGAACTCTCAAA 
GTTTCTAAAGCCTTAGTTTCAGCTTGCTAGAAAACCTATGTTGAGTATTATGGCTAGTTC 
CATAGTTGAGTTGGGAAATGTCTTTGAGGAGACACTTTTTCACTTTGTATTCATCTGTAC 
ATTTTCTGTTACTTGCATTCTGTCATGCTCAGGCTATTAGAGCAGGTACATTTTTATAAC 
TGGAATGTTTATGTGTAGTGAAGCTCTGAGAGGACTTTGCATTAGATCTCAGCAGCATAA 
TCAGAAGGTTGTCCTTTGTCTCAGCAATTTTTAAGCTAATAGTAGCAGAAATTGCAGTGG 
AAATAGACTGCTTTGCCACAACATTCAGAAAATCATTTATCTTTTTATTGCAGTTCTTGT 
CACCAAACAATACATTTTAGTACTTCTCAAATTGCAGAACTCTCATAGGGCTGGGAAAAT 
GCCTGTAGACACATACATACTATGAATGTGCTAATGTTTTTTGTATTTTCATAGCCCATC 
AAAGCTCCTGAGTCAGTTTCCACTATAATCACTGCAGAATCAATCTTCTACAAGGTAAGC 
TTTTGTAGAGTTACTGAAGGAAGAGTTGGGCCTAGTGGGTAATGTGCCACTAAAATGTTG 
GATTAGTCTAAAGGTCTCTGCTACTCTTTATTTGTATAAGGTGTGATTATACTTTTTGTT 
CCCTTCTTAGCTGTTTTCCCCCATAAGTGGCTGTTATTAAAACATCTCATCTAGAGCTGA 
AGTGGGAGGAGAAAGTGCCTACTGACACATGATGTGAGGATCTTAAGTATTTTTTTTTAG 
TGTAGATTGTAGGAATTATTCTTAAAATGCTGATTGTATAGTGTGGAGCCATGGAAGACT 
GAGCCGTTAGTGCGATGGCATTGAAGAATGAGAAGGACAGAGACAGGATTTGGACTAGTA 
GAGGTTGTCGACTGTGGTGTCAAATGGGTAGAGTAGGCCCAGAGATTCTAAAATGCCTTT 
AAGTGGAGTTGAGCTGAGTAAGGGCAGTAGTGAGGATTAACACCTACTAGAAATTCATAG 
TGAGAGGAATTCCAAGATGTTTTGATAAAAGAATGAGGAGGTCAGGTTTCCCAGGGCCAA 
AGTCCATGAACATCTGATACCTCAGTGAGAGAAGTGACAGATTGTTGTGTTTAAACCAGA 
AGTCTTAGGAAAGGAATTAGAACATAGACCCCCAAGGCTCGGCAGGCCTGGCACGGCACA 
GGCAGCAACCATTGAAGGCTATTTGGTGTTTCGGGATCTGAACTGTCATTTAGGGGACAG 
TGGTGTGAGTTAGTACTTTATACTTGACCCAGGTGGACTGAGAAACTCAAGTGATGATGC 
CCTTAAGTATACTTTTTTTTAAGCCCACAATCTATATAGTCGAAGTCTGTTCCTCCCAAC 
AGGGGTACACTGGCATTCCTCAGCAGGGCTGGGAAAAACCAACAACAAAAAAAGTCTGTA 
CACAGGCAAACATCTCTCTTATTTTTCCAACATTTAATACATTGTTAATAAAATATCTAA 
AGTTTAGCAAACAGTTGCTGTGTATCAGTGGCTGAGCATTTTGCATGCTTTATTTCATTC 
AGTTCACTCTATGAGGTGGATACTACTATCCCCATTTTCTAGATGAGAACATTGAGGCAC 
AGCGAGGTTAATTAACTTGTCCAAGATCACATAGCCAACAAGTCATGGAGTGAGGCAGTC 
TCATGCCAGAGCTTAAGCCTAGAGCATAGTTCCTGGCTCTACAGCTTTAGCAAGTGACTG 
GCTATGTGACGAGGACCAACCTCTCTAATGTCTCATCTGTAAAATAGGAATTGTAAATAG 
TTACTACCTCAGTGGGTCAAATGAAATCATATGTGTTAAGCACTTAGCAGAGTAAGCACT 
CAATGAATAGTAGGAGTTATCACATCTTCGTATTTGTGCATTACCTTCACAGTTTACAGA 
TTAAGGCCAGAAGCAACTTGTTGAGCTACGGGTTTAGTGTACTAACAGTTTCCATGTGTG 
TCTCCATGGAAGGGTGTGTGGGACCTGTTATTGTGACTGTCTGTACTTTCGTATTGTTGT 
CTGCCACCCATGTTTATTAAATGATAAGGACAATAATGCAACAAAGTAGTCAAGTAATGT 
TGCAAATGCCCAGTATTGTAGTGGCTATCACAGCAGTGCCACTGGCAGGCAGCACCATGG 
TGGCAAGTTCAAGAGGTCACTGCCAGCCACTGAGCTAGAGCCCAGATCAGGCATGCAAGA 
GGAGCCTGAGTGGGAGCCACTGGGGATCACGGCCAAGAGTGTGACCACCCAAGACCCAGA 
ATGGCTGAGTGGCCTCCCTGGAGCATGGCAGTGGCAGAACAACTCCATGAACTCAGATCT 
GGTGATGCCTAAACTAGTGCTGTTCTCGTGTGGACCCCTTTTCTCTACCAGAAACCTTGA 
ATCCTCTCAGCAAATGAGGAGACTACTCAGATCAGTGACTTAGTCCTGTTTGGTGTTATA 
TATGTGTACACAACACAGCACATATTAATAAATACCTACTATGTGCCAGGCACTGCCTAC 
CACTGGAATCTTTCACTAAGACATTGTTTTTACTTTGCATTTCTGCCTTTACACTATGAA 
AGTAGATGTTTTGGATTCATATTCATTCAGCATACATTTGAATATGCTGTGTTATGCATA 
GTAAGCCTATGATAAGCAAGTATTCTCATTTAGAATTTGGGAATATTGATTATACATGTG 
GACAAACAAACCATAAATGCAAACTATTTATATGATAAATAACTTTGGACTGATGGCTGG 
GAGGAAGGACCAGCTATTGATGGGTAGGAACTAGCAAGTAGCGGACTGTGGCCTGCATAG 
ACCAGACCCATCCGTAGTGATCCAGATGAAACAGCCACCCTCAGACACTTGGATAAAGGG 
TCCACCAGGAAAAAACTCCTGGCCTATCAGGTGCTATGTTACAGTTCAGTTACTGGAAGT 
ATTTCCTCAAAAGTGTTTTTATGGTTGAGGTACACATTCCTACAGCTTTACCTGCTGCCA 
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AGTCCCTGTTTCAAGGGAAGCAGCAATGAATTACACTGTTCCCGTAGTCAAGGACAGTAT 
ATCTTACCAAGAACTATACCCACTTAAGGAGGTGCTGGATGTCATAAAGATTTGGATCAA 
CCATTATGGGTGTTCAGAGGAGAGATTATTTCCAGCTCAAGACCCAGGGAAGAGGACATA 
GGATGGATACCAGAGTCATAGGGAGGATTTAACACAGGACATGTACACATTAGTTAGTTG 
GGTATAAAGTGGAACAGAAATGAATGAGACACAAAGCCTTGAATGCCAGAAATACTAGTA 
GTCCTGTTGTGGAAGGATATAAAACTCAACTGGGAGTGGAAGAGAAAGGCAGCAGTGAGT 
CTAGGAGATGTACAGTAGGTTGAGGTAAACATATCCTGAAGACTATAATCCAAAGATTAT 
TTTTGGTTTGAATTTGTTTTGGTTTGAATTCATGGTATCTATTTTCTTTGAGTGGATGGT 
TGGGGAGGGTGGCATGTAGAATGCATTCTTACCAAATCAGCATGATTTTCAAGACAGTAC 
AGAGAAAAGACTGCTGAGCTGATGTAGGAGCTTTGGCTGCAGTCTCTATGGCTTTCAGCA 
AGCCGTTTAACCTTACTACTGCTTCATGACTGTGGCTAACAAAGTAGGGATAGTACGGAG 
CACAGAGGATTTTTAGGGCGGTGAAACTATTAATACTCTCTTTGTATGATACTATAATGG 
TGGGTACATGTCATTATACATTTGCCCAACCCCACAGAATACACAGCACCAAGAGTGAAC 
CCTAATGTGAACTCTGGTCTTTGATGATGCTATGTCAGTGTACGTTCATCCGTGTAACAA 
GTGTACCACTCTAGTGGTGGGAGGGGTTATTGATAATAGGGGAGGATGTGCATGTGTGGG 
GGCAGGAAGTATATGGGAAATCTCTCTACTTCTGCTCAATTTTGCTGTAAACCTAAAACC 
TCTGTAAAAAATAAAGTCTATTTTTTAAAAAGTGGGGATGGTATTACGGCAATATAAAAT 
CAAAATACTTTATGAACAAATCTTTTCTCCAGATGTAAACTGTCATATATGCACCCTCGT 
ATGTGTATGTATAATTTTCATTCAAACGTGAAACAACTTTAGAATTGGCACCAAACATAT 
AAACACTGATACATTAGACTATCTCGAACACCTTTTACTGACCACTTTGAAAACTTGCTT 
ACCTATTAAGGTTCATTCATAGCTGTG ATGTTCTATTTTTATTTTCAATGTGGGATTATC 
TTCTGTTTCCCCCAGGGAGTATATTACCAAATTGGTGATGTTGTTTCTGTGATTGATGAA 
CAAGATGGAAAGCCCTACTATGCTCAAATCAGAGGTTTTATCCAGGACCAGTATTGCGAG 
AAGAGTGCAGCACTGACGTGGCTCATTCCTACCCTCTCTAGCCCCAGAGACCAATTTGAT 
CCCGCCTCCTATATCATAG GTAAGTTTGACAAATGGCACAGGTTTTTTTTTAACTTAGTT 
AACTCTCCAATATTATGTAAAAGAGTGTGTTAGTCAGCTTGGGCTGTCAGGACAAAATAT 
CACAGACTGAGTGGCTTAAACAACAGAAAGTCACTTTCTCACAGTTGTGGAGGCTGAAGT 
CCAACATCAAGGTGCTGGCAACACGGATTTCTGGGGAGGCTTTTCTTCCTGGCATATAGA 
TGGTCACCTTCTTGCTGTGTCCTCACATGGCCTTTCATGGAGTGAGAGCTCTTTGGTGTA 
TCTTCTTATAAGGACACCATTTCTGTCAGATGAGGGCCCCACCCTTATGGTTTCATTTAA 
CCTTAATTGCCTCCCTAAAGGTCTCATCTCCAAGTACCATCACATTGGGGATTAGGGCTT 
CAACATATAAATTTGGAGGGTGGCGGGGGGGGATGCAATTCAGTCCATAACAAAAAAAGC 
ATGAGTATTATTAAGTACAAAAAAATTAGAGAGCTTTATAGAAAATATGAGGCATTTTAT 
GTAGCTGGAGTGTGAGTGCTATCAGTTATTTTGAGTTAGAGCAATGTGCATCTACTAAGA 
AGTGGTATGGATAAGATTTTTTTGGAGTGACCCAGGGTTAAACTGTACTACAAGAATGTA 
TTGCTCAGGAACTAGGTTATTTAGGTTACTTATTTATACAAACCTATTCAAAAATAATTT 
AGGAAAGAACTATCCCAGTTATCCCATACTTGCAAATTCTCAATATGTGTGCCTCTGCAT 
GCTACACATGTCATCTTAGGCCTTTATAGTATAAAGGCTGATAGTTGAAATGGCAGCTGC 
TGTGCTTTTGTTAATTTCAAAGCTGCCAAAACAGTTGTGAGATAGACTCACAAGAATTTA 
CTGATTAATACAATTTTTAAAGTTTTCAGATTTTTACAGTTACTTCAGACTTTTTATCTT 
TCTGCAGTGAGCATGCATCATTACTTTTGCATCCTGAGAACAAGCATAAGTGTGTTTTTG 
GAGAGAACT C CAGGGAC AAATAATATAC CACTGTTATTCTC AC CTATATGT CAAGTTTGA 
TACATTACCAAACAATTCTAGCCTTCTGCTTATAAGTATATAGAATTTTTATTTACCTTA 
TCTATGGATCAGGATCTCAGCAGAGGCAGTGATGTATCAGAATCACCTTCGGGATTCCTC 
TACTGCCTCCTCTTTCTAATCCCCAGATTCTGATATGCATCCTTGTCCTACAGCGAGGCA 
GCATGGCATGAGGTCAGAACACCAGTTCTGGAGCCAGACTGTCTAGGTTCACAGCCTGCC 
ATTTACCGGCCATGTGACTTTGGCAAGTTTCTTAGTCTCTCTTGCCTCACTTTCCTCATA 
TGTAAAATGGGAATAATAATAGTGCCTACCTCAGAAGGTTGATGTGAGGAATGAAGGTAT 
TGATACATGTAAACTTAGAGCAGTGTGGGTACAAAATAAACATGATGCAAGTGTTCAATC 
ACTGTTTTTGGGAGAATGCCATATTCTTTAAGCCGTTAAAGAAGAAAAAATGATTAAGAA 
TAATTTCAAAGTAATGCATGTTTCAAGGGCTAATGCCAGGTTGCTCCCAGAGTGGTCTCT 
CCCAGTGTCTAGAAATTTTAACATCTTATGAAAATGATATATATGGTCAAAAATGTATTT 
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AACCTTTCCCTTGGCTGCCTTCCAG GGCCAGAGGAAGATCTTCCAAGGAAGATGGAATAC 
TTGGAATTTGTTTGTCATGCACCTTCTGAGTATTTCAAGTCACGGTCATCACCATTTCCC 
ACAGTTCCCACCAGACCAGAGAAGGGCTACATATGGACTCATGTTGGGCCTACTCCTGCA 
ATAACAATTAAGGAATCAGTTGCCAACCATTTGTAG TTCACAAATTAAAACTGGGTTTCC 
AGGCCTGGTGTGGTGGCTCACGCCTGTAGCCCCAGCTATTGCACCACTGCTCTCCAAGCT 
GGGCAATGGAGTCAGATTCTCTTTCTTAAAAAACCACAAAAAAACTGGATTTCCAGTTCT 
CTAATATTCTTAGTACCACAAGATATGTCATAGGTATCTTTAAATGAAATTCTTAGCTGG 
AAAAGTGACTAAAAAGTTTTTCTCCTGCTACCTAGTAATAAACAAATCATTGTTTATTAC 
TGGTCACTTAGAAAATTAAAAGGGATAGGGCCAGGCACAGTGGCTTATGCCTGTAATTGC 
AGCACTTTTAGAGGCCGAGGCAGGCGGATCACCTGAGGTCGGGAAGTGGATCGCCTGAGG 
TCAGGAGTTCGAGACCAGCCTGGCCAACATGGCGAAACCCCGTCGCTACTAAAAATACAA 
AAATTAGCCAGGTGTGGTGGCATGTGCCTGTAATCCCAGCTATTTGGGAGGCTGAGGCAG 
GAGAATCGCCTAAACCCAGGAGGTGGAGGTTGTAGTGAGCCAAGATTGCACCGCTGTGCT 
CCAGCCTGGGCAACAGAGTGAGACTCTTGTCTCGGAAAAAAAAAAAAAAAAAAAAGGCTG 
GGCACAGTGGCTCACGCCTTTAATCCCAGCACTTTGGGAGGCTGAGGCAGATGGATCGCC 
TGAGGTTGGGAGTTCGAGACCAGCCTGGCCAGCATGGTGAAACCCTGTCTCTACTAAAAA 
TACAAAAATTAGCCAGGTGTGGTGGCGCACACCTGTAGTCCCAGCTACTCGGGAGGCTGA 
GGCAGGAGAATTGGTTGAACCCAGGAGGCGGAGGTTGCAGTGAGCAGAGATCGTGCCACT 
GCACTCCAGCCTGGGTGGACAGAGCAAGACTCCGTCTCAAAGAAACAAACAAAAAATTAA 
AAGGGATAGAATATAATGAAATATATTTTGAACTTAAATTATATTCTATATGTGTATCTT 
CCTAGGCAAAAGCTGTAATTTCCAGAGAGACCATTAGGAACAGGTAGTATCTATTTTTCT 
CCATTATTTATTTCTAGAAACTCATAAAATGGATTGTATTTTTCTATAAGAACAAAATAT 
TAATTAAGGTATAGATGACTGACCAAGGGCTTAATCAAATAAAATGACTAACAGCATCTA 
TCATAAAGCCACACAAGCCTTATGTTCTCATCTCAAAAATGCTGTGACAGCTTTTTGGCT 
GCTTTAACCATAAGAAAAATGATTGGTGGATGATTTTATTAGCCCAGGCTTTTAAAAACT 
TTCATCTAGGCCACGTGCGGTGGCTCATGCCTGTAATCCCGGCACTTTGGGAGGCCTGAG 
TGGATGGATCACTTGAGGTCAGGAGTTCAGGACCAGCCTGGCCAACATGATGAAACCCTG 
TCTCTACTAAATATACAAAAATTAGTTGGGTGTTATGGTGCATGCCTGTAATCCCAGCTA 
CTCGGGAGGCTGAGGCAGGAGAATTGCTTGAACTCGGGAGGTGGAGATTGCAGTAAGCCG 
AGATCGTGCCACTGCACTCCAGCCTGGGTGATAGAGCAAGACTGTCTCAAAAAAGAAAAA 
AAAGAAAAAATTTTAATTTAATCCTTCTGTAGAAACAGGCATTCAGAACCATTCCATTGA 
TCTTAATAAAGCTGCTCTTTACTGTTTCTAGTCAAAAATGAGACTTCGATCAAACCATAA 
GATTTTATACTGCAGATAGTCAGCTTCACCAAAGCCGCAGAGGAAACATGTCGAGATCAG 
GCTTCCTGCTTGATAGTCTCTTGACTACCATTAAAACGAATATTGGGAGGTCATGAAAGT 
CATTGGTAGGCCATTAGCATTGATATCTTTAAAACATCTACCCTAAACCATCTGCTATGG 
ACCCATAATAAGAGGCCTGTTGTATATGAA ATTGTCTAGAATTCAGGTGCAGGTCTTTGC 
CGGTTAAGTAAGGGAGCAACACGTAAAATGGGAGAGGAGTGGGGTGTACTCACTTGCCTC 
CTCTTTTGTCCTGATTTAACCAGCATTTTTCAACCCTGGGAAAATTTGCAGAATCTAAGT 
TGATTGTAATGATTTTGAGCTGCAGCAGCTTTAACTCTTACCCTTTTTGCACATAGTTAT 
GGTGTTTGAGTTGGAAAGAAACAACTATAGGTAGCTACACGTACATAATTATCTCTTTAT 
TCACAAAGGGTATAGTAAAATTGATTGTAAATAACTTTCTAAGTGCCAATATTCAAAACT 
TTTGGATTAAAATGTATTTTTCACCGTGCATTTACTTTGGATGTATTTATTTCATTTAAA 
CAATTTAAATGGGGCTCTTTAACCAAAA ATGGTATTTAAAACCAAAACAGTATCGTACTT 
AGAATTTGGAGTAGAGGCCGGGCACAGTGGCTCACGCCTGTAATCCCAGCACTTTGGAAG 
GCTGAGGCAGGCGGATCACCTGAGGTCAGGAGTTCGAGACCAGCCTGGTCAACATGAAAC 
CCCGTCTCTACTAAAAATACAAAAATTAGCTGGGCGTGGTGGCGTGCGCCTATAATCCCA 
GCTAGTCTACTCGGGAGGCTGAGGCAGGAGAATCGCTGGAACTCAGGAGGCAGAGACTGC 
AGTGAGCCGAGATCGCGCCACTGCACTCCAGTCTGGGTGACGGCATGACTCCATCTCCAA 
AAAAAAAAAAAAAAGATTTTGGAGTAGATTCATCATTAATAAGTAACAGATTTTAGGAAA 
ATCAAAAAATGGCTAATAAAATGAACACAATGTAAAACATTTATTAAAATGTAGACTTTT 
AAAAATCTATAAATTGATCATCTGTTTATAAATTGGCAGATGGTTGTGTACCATCTTTTA 
AAATAAAGATTG AATTT C AC C C AGTGTGATGGTTCC C ATTG CTTAT ATTT C T C C TG CTG A 
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GGCCGGACCTGATATGGCCCTGGTCTGTGTTCCCAGCCTTGTTTCCTCATTACCACTAAA 
ATCTTTCCCCTGTATGCCCGCCCAATTTTTCTGGCTCTGAGTCCTTGTTCATACTGTTCT 
CTCCAATTCTACCTTCCAAAGGCCTTTCTTAACACCTTCGGATTCTTTCTTTGAGAACTT 
TCCAGATTCCCATGCCTTTTTGGAATCAATCTCTATCCTATTGTCATCACATTTAAGTTT 
CTACTTCCATCATCCTCACTCCTATCCCTTTGGTCCTGGGATGACAGGGATGCTGTGTTT 
TATTTACTCATCTTTGTAACTTCCACATAACCTAACCCCGGTTCTTGCTTATGGGAGATG 
CTGATTGTAGGGTCTGAGTTAGATACTGTTAACTAAAATGCTTGTTGATATTTTAGTTAT 
TAATTCATATTAACTTTGGCTGAAACTTTTAAATTCTATTGTGAATAGTCAAGTAAAATT 
TAGATTGTTACATTCTGGGTTAGTATTAGATTGTTTTTAAGATTGTTTTAAACAAGATGT 
TTTTAAGATGAGTTTTAAATAGTTCTCTTAACACAAATAAAGCTTAATATGAGTATTTGA 
AGGAAATTATCCCAAACCATTCCAGTTCCTGGCTGTGAAAGGCTTTTCCAGGCCTAATAA 
GTTTTCCACTTCAGCCGTAAGTAGGTG AAATCAAATGAACAATAGAGGGAAATGTATTTA 
TTTGCTTTATACACATGCATGTGTGTTGTGTCTACATATAAACATTGCACACGCTTAGAA 
TGAAGTTTCTGTCATGCCCAGAAAAGGGAGAGGCATTTTTGTGGATTTTGTCTGGCTGCC 
CTGGGGATGTTTGAAGAACTGTGCTGTTTACTTCATACCAGGTGTGTGAGCCATACCTTT 
GGTAGGAGGGTATACCTCCTACACCCAAGAAATATAAGCCAGGAGAAGGTCTGTGCCAAG 
AG AAGG AAC C C AAATGAC C C AC AAGAGGTGGG C C ATT AATT ATTGGGT C AG AT GC ATAAA 
TGCACAGTAATTTATTTAAGCACCTCTTAATGGTGACCCACAAGGAAGATTGCTCGTAGT 
AG C GGAAAG GT T C AC AAT AAAT AAGAG AAAAAAG C AG AATG T AG AAC T G TAT GAT AG C AA 
TTCTGCAAACAAGAAGCATCTTTTATAAAAGATGGAAGGAGCCCAGGCACAGTAGCTCAT 
GCCTGTAATCCCAGCACTTTAAGAGGCTGAGGTGGAGGATCACTTGAGCTGCAGTGACCC 
ATGATTGTGCCACCACTCCAGCCTGGGTGATAGAAGTGAGACCTTCTCTCAAAAAAAAAA 
AAAAAAAAT^AAAAGACGGAAATTCCTCCAGAATTTTAACATGTCAACAGAGGTTTTCTGC 
AGCTACTTTTTTCAGCTTTATACTTCGCAGTATTTTCCAAATTTTCTCTAACAAGCAGTA 
TTTTCCAAATTTTTTACAATAAGCACACACACACACACACGTTTGTTTGCATAAGTGCCC 
AACTGGTGGTGAACAACCGCTGGCTTTTAGTCTATACATATCTAGAATATTTTATAAATA 
GTAGTTCTTAAACCCTTGAAAGGGAGTGAATGACCAGCTGAGAAAATAAAGTCAGTGATT 
TCATTATTTTCCTATATTCACATCATGATTCTAGGAAAGAACTTGGGAGTGACTTCCTTC 
AGCTTCAGCCACTCCTGGGCCAGGCGCATGCTTAGCTCTGTGGTAAAGGTCACCAGCTTC 
TTCTGCAGGGTGCCTGTATCATCTGAATTGGAGGTTTGGCGAGGGTAAGAGACTGATGTA 
GGTTCAAGTTTTTCTTTCCTGTCCTCCACTTGAAATCTGTCTTCCCTTCCAGACTGCCTG 
CGCTGCTGACTTAAGGCCCCAACACCAAACACAGAAGCAACAGCCTTACACAGAGTGTTC 
AGCAAGCTCCAACAATTGTGTAAGGTAAAGTTTCCTTTATAGATTCCTTTTCTATATCGC 
TCCTAGTGGTTCTGTTTCTCTGATCGAATTCTGGCTGATAACAGTTGCTGAGACTCTGAA 
AGAGAAGGCAAGGAACTACTGTTTCTCATTATAAACTGTTTAGAATTATTTGGCCATCTT 
TTTGCTATGAATATGTAGTGCTTTGATACATTTTTTAAATCAAAAAGTAATGAAAGAGAT 
CACATAGGGAAAGATAGATTGGATTATTTTTAAAGTTTATATACTAAATTGAAAAGCAAA 
GAATAAAATGGGAGAAACAGCTCCCTCATGTGGCTGTTGGCAGGAAGCTTCCATTCCTCT 
CTGTGGGCCTCCACAGGTTTGCTCACAGCAAATGGTCCGTGACAGAAAGACGCAAGGGCA 
GTTGCACCCAAGATGGAAGCCACCATCTTTTCTATAACCTAATCTGAAAGAAGGGACATA 
CCAGCACTTCTGCCATATGCTGTTGGGTCACACAGACCAACTCTGGTACAGTGTGAACAC 
AGGAC CACACAAGGGCGTGAATTC C AAGGGC AGAGAC CACTAGGGAC CAC CT C AGAGGCA 
CAGAGGGACACCCTATCCAGCTGGTGGCCAATGTAAATTAACATAGCTTTTTAGAATAGC 
AATATGTATCTATAATCTTAAAAGTATTAAAAGTACTTCTTGATCCAGTAATTTCATTTC 
TAAGAATCCATGCTAAGAGGATTTAAAATGTGGACCAAAAAATGGGTATAAAAAGAAGTT 
GTTAACAGTATTTAAAGTTGTGAAAAACCAGAAACAATCTAAAGGTCCAACAATAGGAAA 
ATGAATTTTGATATTTTTCTAATAGAATTTTATGCTGTCATCAGAAATACCATTTACAAA 
TAATTTTTAATAACGCAAAAAAAAGTTTATAAAATGTTTAGTGTAAAACCTGGACACAAC 
TACATAATGATTCTGATTTTGTAAAAAAAAAAAACAAAAACACACACATATACACATGCA 
TACATATGCATATAAAGAAAACTGGAACAAACAAAATAACAAGCATAGTTGGAATTACAG 
TCATTTTAATATTCTTTATGCTTTTAAAAATTTTGAAGTTTGTATTACTAGCATCCACTA 
CTTACGTAGTCAGGAAAAAAATACAACTTTAAAATAGATATTTAGGTCCAAAGATGGTAA 
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TCTAAATGGTGTTACAGGCTGAATGTGTGCCTGATCCCCATGCCCCAAGTTCATATGTTA 
AAGCCCTGGCCCCCAAGGCAATGGTATTAGGGGAGTAGGGCCTTTGGGAGGTAATCAGAT 
TTCTACGAGGTCATGAGGGTGGAGCCCGCATAGTGGAATTAGTGTCCTTTTAGGAAGAGG 
AGAACAGACCAAAGCCTTCCTTTCTCTCCTCACTATGTAAGAAGACAGCCAGAAGGTGGC 
CACAGCCAGGAAGAGAGCTCTCACCAGAACCCAAATCTGCTAGCACCTTGCTCTTGGGTT 
CTCAGCATCCAGAACTGTGAGAAATGAATGTGTGTTGTTTAAACCACTCAGGCTACGGTA 
TTTTGTTGC AG CAG C C C AAG C TGACAGAGAT AGAAACAACACAAGGACC CAT CAGC AGAC 
GAATGGATGATCAAAACGTGGTGAGGTCGTGCAGTGGGATATTATTCAGCCGTAGAAGGA 
ATGAAATTCTGATACATGCTATAATGATGAACCTTGAAAACATGTTAATGGAAATAAGCC 
AAACTTAAAAGGACAAATATTGTATAATTCCACTTATATGAGTTAGTTACCTAGAATAGG 
CAAATTATGTCATAGATACAGAACATTAGAGGTTACCAGGGTTGTGGGAAGAGGGGTATT 
GTGGGTACAAATTTTCGGTTTGGAGTGATTTTGAAAAAATTCTGGAAATGGGTAGTGACA 
GTAGTCAACATGATGAATGTACTTAATGACACTAAATTGTACACTTAAAAATGGTTAATA 
CTGGGCTGGCGCAGTGGCTCATGGCTGTAAATCCCAGAACTTTGGGAGGCCAAGACAGGC 
GGATCATGAGGTCAGGAGATTGAGACCATTCTGGCTAACATGGTGAAACCCTGTCTCTAC 
TAAAAAATAAAAA.CAAATAAAAAAAAAATTAGCCGGGCATGGTGGCAGGCACCTGTAGTC 
CCAGCTACTCGGGAGGCTGAGGCAGGAGAATGGTGTGACCTGGGAGTCGGAGCTTGCAGT 
GAGCTGAGATCGCGCCACTGCACTCCAGCCTGGGCAACAGAGCCAGATTCCGTCTCAAAA 
AAAAAAAAAAAAAGGTTGATACCTGGGTGCGGTGGCTCATGCCTGTAATTTCAGCACTTT 
GGGAGGCCAAGGCAGGCAGATCAGTTGAGGTCAAGAGTTAAGGACCAGCCTGGCCAACGT 
GGCGAAACCCCATCTCTATTAAAAATACAAAAATTAGTCGAGTGTGGTGGTGGGTGCCTG 
TAGTCCCAGCTGCTGGGAGGATGAGGCCTAGGAATTGCTTGAACCCAGGAGGCAGAGGTT 
GCAGTGAGTTGAGATTGCGCCACTGCACTCCAGCCTGGGGGACAGAGCGAGACTTAGTCT 
CAAAAAAAAGGTTAAAATTGTAAGTTTTGTTATGCATATTTTACCATAATCTTTAAAAAA 
TAGATAT ATAGGAGATAAAGT CAACAGAATTTAATAAC CAG TTGTAAATAGAGACTGAGT 
GAGGAGGATGAATTAAGGAAGACATTGAGTACAACTTTTTGGTAGGTGAAAAACTCTTAA 
AAAAATACGTGGGCAAAGATCCTACTTGATTCTTATAATTTAAAAATCTCCCAGTTAGTA 
AACAAGGCTAGGTGGAGATTTGCATGTGATGTGAGGTGTGTGTTCTGTTTTGTAATGTGA 
GGACTGTGAGCCATCTCCTGGACTTGAATATCCATTAGATAATTGAAAATACGGATTTGA 
GAACTCAGGAGACGTGCAATGCAGTAACAAAACTCTGCACCTAGTTGATTTCTGTCTCCT 
AATTTAATGCTTTTATGGGACAAACTGTTAGGCAGGTGGGCAAGATGGACAGCCATATTT 
TTGTGGGTTTCTGGCCTGTGGGCCAGCCTCAGTGCTCACTCTGAGGTCATGTCCAAACTT 
AGAACACATTCAGGCCTACCACAGTCAAGGCTCCCTTTCTCAACTCTAGTCCTCTGCACA 
AATATCCGAAGCCTAGAAATAATAATCATCTGTCCTTGTGTCTTGCATTATGAAAGCCTA 
GGAAAGGGCCTTGGGAATTAAGAAGAATGGAAAAACTGGTCTAACTGCTGCATGCTTCAG 
CTTGCAGGGGAATCACTGAAATGGGGACAGGCCATAAAAGGACAACCAGAAGAGTGGCTT 
CAGCAAAGGCATCGTTTTTCAGAGCAAGCTAGAGAATCCTGCCAGCGTCCTCAGGCAGGG 
CCCCTGGGCACAGAGGTTAGGCAAGGGAGTGTCCCAGCATGTTGATGCCCTGAGCATCAG 
AATAATGCCATAGAGGAGCTTCCAAAGAGTTCATTTCAGGTTTTGTAAGCCGAACATTTC 
TAGGCAAATAAAATTTGATTTTGTGAATAAAGCTTGTTTCTTCAACTCCAGTGCAGATTC 
TCATAGATTGATAGTGGCTTGTGATCCAGATAAAGAAAACAATTTTTCAAAGATTCATAT 
TCTTTGTAGATGTACGGATTTAGAGACCATCTAATCTAACTCCCTCATTCTACAGATAGG 
AAAAATGAGGCCTAAAGAAGTTAAGAAAATACCATGGAAATGTCACTGCTGAACTGCCAT 
ACGTAGGATCCGAAAGAAATTGGGTAAATGCTACTGTGAGAAATACAGTACTAGGTCCAA 
AGAATCTAATACAAATTAAAAATCTAAATGTTATTTCTAAAGCATCCCTGCACATGGCTG 
AACTTACATAGTTTCATTTTCTTTCTTTTCTGTTGAAGAAGAGGCAATTGGCTGGGTGCA 
GTGGCTCATGCCTGTAATCCTGGCACTTTGAGAGGCCGAGGCGGGTGGATCACCTGAGGT 
CAGGAGTTTGAGACCAGCCTGGCCAACATGGTGAAACCCCATCTCTACTAAAAATACAAA 
AATTAGCTGGCTGTGGTGGCCGCTGCCTGTAATCCCAGCTACTCCAGAGGCTGAGGCAGG 
AGAATTACTTGAATCTGGGAGGTGGAGGTTGCAGTGAGCCAAGATCACGCCATTGCACTC 
TAGCCTGGATGACAAGAGGGAAACTCCATCTCAAAAAAAAAAAGAAAAAAAGCAATCACT 
AACCTGTGTTGTTTATTAAACATGACAGACTGGCATGAAGTAATTACCAAACTGTAAACA 
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AAAAAGCTACAATCTGCCAGGCATGGTGGCTCATGCCTGTAATCCCCCACCTTGGGAGGC 
CAGGTTGGGGGATCACCTGAGGCCTGGAGTTCAAGACTAGCCTGGTCAACATGGTGAAAC 
CTCGTCTCTACTAAAAATACAAAAATTAGCCCGGCGTGGTGGCACATCCCTGTAATCCCA 
GTTACTCAGGAGGCTGAGGCAGGAGAATCACTTGAACCTGGGCAGTGGGGAGGTTGCAGT 
GAGCCAAGATCGCACCGTTGTACTCCAGTCTGGGCCGACAGAGTGAGACTCGGTCTCAAA 
AAAAAGAAAAAAGAAAAGCTACAACCTTAATCTCAACTTCTCATAACATCATCTCTACTT 
CTGATTAGAAGAGTGGAAGTGGGGAGGTTTATTACAAAAAGACTGTTATACCTTACACAC 
TTCTCCCCATGAATAGTGAAGGTGTGAGTGAAAAAGACAGCAATTTTATTTTTTTTTTGA 
AACAGGTTCTTGCACTGTCACCCGGGCTGGAGTGCACTGTTGTGATCACTGCTCACTGCA 
GCCTCCACCTCCCAGGCTCAAGTGATC.CTCCTACCTCAGCCTCCTGAGTAGCTGGGACCA 
CAGTTGTGCACTACCATGCCCAGCTATTTTTTTTTAAGAGATGGGGTCTCACTATATTGC 
TTAGGCTAGTTCTCAAACTCCTGGCCTCAAGCAGTCCTCCGACCTTGGCCTCCCAAAGGG 
TTGTGATTACAGGCATAAGCCACCACACCCAGCCAGCAGTTTTAGAATAAAGGGTGAAGG 
TGCTGTTGGGGAAATATAATTTAAAAAACAAAATCTTCTCTCAACCCAGAAATCCTCTCC 
ATGAAG GCAGTAGAGAAAGATAAGCTTTATTATTGAATAAAAATTAAATGAGAATGTGAT 
GCACATCACAGGCACTTTGCTAAGAGATCACAAAGACAGAAGGAAATTTCACCATTTTGT 
ACAGCCAAGCAGGTACAGCCCATTAGATGTATGTTTTCGAGATAAATAGTCCTCAACTAA 
GAGAACTTGACAGCACCACTGGTCACACAGTTCATTCTAACTTTACCTGATAATTGATGT 
GACCACTTGTGTTATCTAAGATATCAACTTTTCGGGGGTGGGGGAGTGTGGAAACAGGAG 
TTACTTTTATAGCTTGGTGCAAGGTACTCATTAAGATTAGGCTGTTACCCTCCCACAGAA 
ACTGGAAGATAGGTATGCTATCTGGTAATGTTTACATTTCCCAGATCCTTGAGAAAGACA 
TTCCTAGGTCATAAAGCTGACAAAAGGCTGATTCAGTTTTTAAATATATATATCTGTATA 
TGTATTTCA 
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actgagagacaggactagctggatttcctaggctgactaagaatccctaagcctagctgg 

MINI MIMIIIMI MIMM III! IMMMIM II 1 1 1 1 1 1 1 I 1 1 1 II 

actgagagacaggactagctggatttcccaggccgactaagaattcctaagcctagctgg 
g-aaggtgaccacatccacctttaaacacggggcttgcaacttagctcacacctgaccaa 

I Ml M ill II MINIMI I Mill MM IMMMIM MM 

ggaaggtgaccacaccctcctttaaacacagagcttgtaactcagctcacacccgaccaa 
tcag agagctcactaaaatgctaattaggc-aaagacaggaggtaaagaaa 

MM M MM MM I I I II I I II J I I I II I I II I II I I II I I 

tcaggtagtaaagagagctcactaaaataccaattaggctaaaaacaggaggtaaagaaa 
tagccaa- teat ctattgcctgagagcacagcaggagggacaatgatcggga tat aaacc 

II III llllllll IIIIMIIIIM IIIIIIIIMMIIIMIMIIIIIM 

taatcaaatcatctatcgcctgagagcacagggggagggacaatgatcgggatataaacc 
caagtcttcgagccggcaacggcaaccccctttgggtcccctccctttgtatgggagctc 

II I II Mill I II Mill ! 1 1 I i I I 1 1 1 I I E I I MINIMUM 

caggcatttgagccagatcaggtaaccctctttgggtcccctcacactgtatgggagctc 
tgttttcatgctatttcactctattaaatcttgcaactgcac--tcttctggtccatgtt 

MM " I I I I 1 1 M M I I I II I II i I I i I I I I II IMMNIM 

tgtt ttcactctattaaatcttgcaactgcacactcttctggtccatgtt 

tcttacggcttgagctgagctttcgctcgccatccaccactgctgtttgccgccaccgca 

I II II 1 1 1 1 1 E 1 1 1 1 1 1 1 i MIMM E 1 1 1 1 1 1 1 1 1 1 1 1 llllllll III 

tgttccggctcaagctgagcttttgctcgccgtccaccactgctgaatgccgccattgca 
gacccgccgctgactcccatccctctggatcatgcagggtgtccgctgtgctcctgatcc 

MM III Mill III Mill Mill MM SIMM IMMMIM 

gacctgcccttgacttccacccctccggatccggcagagtgtccgctgcactcctgatcc 
agcgaggcacccattgccgctcccaatcgggctaaaggcttgccattgttcctgcatggc 

MM MINIMI Mill III I I I : I ! 1 1 1 I M I I M I ! 1 1 1 1 M M I II 

agcgaggcacccattgccactcccgatcaggctaaaggcttgccattgttcctgcacagc 
taagtgcctgggttcatcctaattgagctgaacactagtcactgggttccatggttctct 

M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1! I IMMMIM III tllllllill llllllll 

taagtgcctgggttcatcctaatcaggctgaacactggtcgctgggttccacggttctct 
tctgtgacccacagcttctaatagagctataacactcaccgcatggcccaaggttccatt 

M MM I MINI M Ml II MM III INI M II 1 1 1 1 1 1 II II II I II II 

tccatgactcacagcttctaatagagctataacactcaccacatggcccaaggttccatt 
cctt-gaatccataaggccaagaaccccaggtcagagaacacgaggcttgccaccatctt 

I II llllllll IIIIIIIIIIMIIIMIIMMII I MM III lllllll 

cgttggaatccatgaggccaagaaccccaggtcagagaataaaaggcccgcc-ccatctt 
gggag 

Mill 

gggag 
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TCCTGTGAAC CTCTAGAGGA TTTGCGCCTG CT CTTCAAAC AACAACCAGG A GGAAAG T AA 7 8 60 

CTAAAATCAT AAATCCCCAT GGCCCTCCCT TATCATATTT TTCTCTTTAC TGTTCTTTTA 7 92 0 

CCCTCTTTCA CTCTCACTGC ACCCCCTCCA TGCCGCTGTA TGACCAGTAG CTCCCCTTAC 7 93 0 

CAAGAGTTTC TATGGAGAAT GCAGCGTCCC GGAAATATTG ATGCCCCATC GTATAGGAGT 8 04 0 

CTTTCTAAGG GAACCCCCAC CTTCACTGCC CACACCCATA TGCCCCGCAA CTGCTATCAC 8100 

TCTGCCACTC TTTGCATGCA TGCAAATACT CATTATTGGA CAGGAAAAAT GATTAATCCT 8160 

AGTTGTCCTG GAGGACTTGG AGTCACTGTC TGTTGGACTT ACTTCACCCA AACTGGTATG 8 22 0 

TCTGATGGGG GTGGAGTTCA AGATCAGGCA AGAGAAAAAC AT G T AAAAG A AGTAATCTCC 82 8 0 

CAACTCACCC GGGTACATGG CACCTCTAGC CCCTACAAAG GACTAGATCT CTCAAAACTA 834 0 

CATGAAACCC TCCGTACCCA TACTCGCCTG GTAAGCCTAT TTAATACCAC CCTCACTGGG 8 4 00 

CTCCATGAGG TCTCGGCCCA AAACCCTACT AACTGTTGGA TATGCCTCCC CCTGAACTTC 8 4 50 

AGGCCATATG TTTCAATCCC TGTACCTGAA CAATGGAACA ACTTCAGCAC AGAAATAAAC 8 52 0 

ACCACTTCCG TTTTAGTAGG ACCTCTTGTT TCCAATCTGG AAATAACCCA TACCTCAAAC 858 0 

CTCACCTGTG TAAAATTTAG CAATACTACA TACACAACCA ACTCCCAATG CATCAGGTGG 8 64 0 

GTAACTCCTC CCACACAAAT AGTCTGCCTA CCCTCAGGAA TATTTTTTGT CTGTGGTACC 87 00 

TCAGCCTATC GTTGTTTGAA TGGCTCTTCA GAATCTATGT GCTTCCTCTC ATTCTTAGTG 87 60 

CCCCCTATGA CCATCTACAC TGAACAAGAT TTATACAGTT ATGTCATATC TAAGCCCCGC 8 82 0 

AACAAAAGAG TACCCATTCT TCCTTTTGTT ATAGGAGCAG GAGTGCTAGG TGCACTAGGT 88 80 

ACTGGCATTG GCGGTATCAC AACCTCTACT CAGTTCTACT ACAAACTATC TCAAGAACTA 8 94 0 

AATGGGGACA TGGAACGGGT CGCCGACTCC CTGGTCACCT TGCAAGATCA ACTTAACTCC 900 0 

CTAGCAGCAG TAGTCCTTCA AAAT CGAAGA GCTTTAGACT TGCTAACCGC TGAAAGAGGG 90 60 

GGAACCTGTT TATTTTTAGG GGAAGAATGC TGTTATTATG TTAATCAATC CGGAATCGTC 912 0 

ACTGAGAAAG TTAAAGAAAT T C GAG AT C G A ATACAACGTA GAGCAGAGGA GCTTCGAAAC 918 0 

ACTGGACCCT GGGGCCTCCT CAGCCAATGG ATGCCCTGGA TTCTCCCCTT CTTAGGACCT 92 4 0 

CTAGCAGCTA TAATATTGCT ACTCCTCTTT GGACCCTGTA TCTTTAACCT CCTTGTTAAC 93 0 0 

TTTGTCTCTT CCAGAAT CGA AGCTGTAAAA CTACAAATGG AGCCCAAGAT GCAGTCCAAG 9 3 60 

ACTAAGATCT ACCGCAGACC CCTGGACCGG CCTGCTAGCC C AC GAT CT G A TGTTAATGAC 94 20 

AT CAAAG G C A CCCCTCCTGA GGAAATCTCA GCTGCACAAC CTCTACTACG CCCCAATTCA 94 8 0 

GCAGGAAGCA GTTAGAGCGG TCTCGGCCAA CCTCCCCAAC AGCACTTAGG TTTTCCTGTT 95 4 0 
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AAGCTCCTTCAGGAGAACAAAGAACAGGCCATTACCCTGGAGAAGACTGGCAACTGATTTTACCCACAAGCCCAA 
LysLeuLeuGlnGluAsnLysGIuGlnAlalleThrLeuGluLysThrGlyAsn . . . PheTyrProGlnAlaGln 
SerSerPheArgArgThrLysAsnArgProLeuProTrpArgArgLeuAlaThrAspPheThrHisLysProLys 
AlaProSerGlyGluGlnArgThrGlyHisTyrProGlyGluAspTrpGlnLeuIleLeuProThrSerProAsn 

ACCTCAGGGATTTCAGTATCTACTAGTCTGGGTAGATACTTTCACGGGTTGGGCAGAGGCCTTCCCCTGTAGGAC 
ThrSerGlylleSerValSerThrSerLeuGlyArgTyrPheHisGlyLeuGlyArgGlyLeuProLeu . . . Asp 
ProGlnGlyPheGlnTyrLeuLeuValTrpValAspThrPheThrGlyTrpAlaGluAlaPheProCysArgThr 
LeuArgAspPheSerlleTyr . . .SerGly. . . IleLeuSerArgValGlyGlnArgProSerProValGlyGln 

AGAAAAGGCCCAAGAGGTAATAAAGGCACTAGTTCATGAAATAATTCCCAGATTCGGACTTCCCCGAGGCTTACA 
ArgLysGlyProArgGlyAsnLysGlyThrSerSer . . . AsnAsnSerGlnlleArgThrSerProArgLeuThr 
GluL.ysAlaGlnGluValIleLysAlaLeuValHisGluIleIleProArgPheGlyL,euProArgGlyLeuGln 
LysArgProLysArg ArgHis . . . PheMETLys . . . PheProAspSerAspPheProGluAlaTyrArg 

GAGTGACAATAGCCCTGCTTTCCAGGCCACAGTAACCCAGGGAGTATCCCAGGCGTTAGGTATACGATATCACTT 
Glu. . .Gin. . . ProCysPheProGlyHisSerAsnProGlySerlleProGlyValArgTyrThrlleSerLeu 
SerAspAsnSerProAlaPheGlnAlaThrValThrGlnGlyValSerGlnAlaLeuGlylleArgTyrHisLeu 
ValThrlleAlaLeuLeuSerArgProGln. . . ProArgGluTyrProArgArg . . . ValTyrAspIleThrTyr 

ACACTGCGCCTGAAGGCCACAGTCCTCAGGGAAGGTCGAGAAAATGAATGAAACACTCAAAGGACATCTAAAAAA 
ThrLeiiArgLeuLysAlaThrValLeuArgGluGlyArgGluAsnGlu . . . AsnThrGlnArgThrSerLysLys 
HisCysAla . . . ArgProGlnSerSerGlyLysValGluLysMETAsnGluThrLeuLysGlyHisLeuLysLys 
ThrAlaProGluGlyHisSerProGlnGlyArgSerArgLys . . . METLysHisSerLysAspIle . . .LysSer 

GCAAACCCAGGAAACCCACCTCACATGGCCTGCTCTGTTGCCTATAGCCTTAAAAAGAATCTGCAACTTTCCCCA 

385 395 405 415 425 435 445 

AlaAsnProGlyAsnProProHisMETAlaCysSerValAlaTyrSerLeuLysLysAsnLeuGlnLeuSerPro 
GlnThrGlnGluThrHisLeuThrTrpProAlaLeuLeuProIleAlaLeuLysArglleCysAsnPheProGln 
LysProArgLysProThrSerHisGlyLeuLeuCysCysLeu. . .Pro. . . LysGluSerAlaThrPheProLys 

AAAAGCAGGACTTAGCCCATACGAAATGCTGTATGGAAGGCCCTTCATAACCAATGACCTTGTGCTTGACCCAAG 
LysSerArgThr . . . ProIleArgAsnAlaValTrpLysAlaLeuHisAsnGln . . .ProCysAla. . . ProLys 
LysAlaGlyLeuSerProTyrGluMETLeuTyrGlyArgProPhelleThrAsnAspLeuValLeuAspProArg 
LysGlnAspLeuAlaHisThrLysCysCysMETGluGlyProSer . . . ProMETThrLeuCysLeuThrGlnAsp 

ACAGCCAACTTAGTTGCAGACATCACCTCCTTAGCCAAATATCAACAAGTTCTTAAAACATTACAAGGAACCTAT 
ThrAlaAsnLeuValAlaAspIleThrSerLeuAlaLysTyrGlnGlnValLeuLysThrLeuGlnGlyThrTyr 
GlnProThr. . . LeuGlnThrSerProPro . . . ProAsnlleAsnLysPheLeuLysHisTyrLysGluProIle 
SerGlnLeuSerCysArgHisHisLeuLeuSerGlnlleSerThrSerSer . . . AsnlleThrArgAsnLeuSer 

CCCTGAGAAGAGGGAAAAGAACTATTCCACCCTTGTGACATGGTATTAGTCAAGTCCCTTCCCTCTAATTCCCCA 
Pro . . . GluGluGlyLysGluLeuPheHisProCysAspMETValLeuValLysSerLeuProSerAsnSerPro 
ProGluLysArgGluLysAsnTyrSerThrLeuValThrTrpTyr . . . SerSerProPheProLeuIleProHis 
LeiiArgArgGlyLysArgThrlleProProLeu . . . HisGlylleSerGlnValProSerLeu . . .PheProIle 

TCCCTAGATACATCCTGGGAAGGACCCTACCCAGTCATTTTATCTACCCCAACTGCGGTTAAAGTGGCTGGAGTG 
SerLeuAspThrSerTrpGluGlyProTyrProVallleLeuSerThrProThrAlaValLysValAlaGlyVal 
Pro. . . IleHisProGlyLysAspProThrGlnSerPheTyrLeuProGlnLeuArgLeuLysTrpLeuGluTrp 
ProArgTyrlleLeuGlyArgThrLeuProSerHisPhelleTyrProAsnCysGly . . . SerGlyTrpSerGly 
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GAGTCTTGGATACATCACACTTGAGTCAAATCCTGGATACTGCCAAAGGAACCTGAAAATCCAGGAGACAACGCT 
GluSerTrpIleHisHisThr . . . ValLysSerTrpIleLeuProLysGluProGluAsnProGlyAspAsnAla 
SerLeuGlyTyrlleThrLeuGluSerAsnProGlyTyrCysGlnArgAsnLeuLysIleGlnGluThrThrLeu 
ValLeuAspThrSerHisLeuSerGlnlleLeuAspThrAlaLysGlyThr . . . LysSerArgArgGlnArg . . . 

AGCTATTCCTGTGAACCTCTAGAGGATTTGCGCCTGCTCTTCAAACAACAACCAGGAGGAAAGTAACTAAAATCA 
SerTyrSerCysGluProLeuGliiAspLeuArgLeuLeuPheLysGlnGlnProGlyGlyLys . . .LeuLysSer 
AlalleProValAsnLeu. . . ArglleCysAlaCysSerSerAsnAsnAsnGlnGluGluSerAsn . . .AsnHis 
LeuPheLeu. . . ThrSerArgGlyPheAlaProAlaLeuGlnThrThrThrArgArgLysValThrLysIlelle 

TAAATCCCCATGGCCCTCCCTTATCATATTTTTCTCTTTACTGTTCTTTTACCCTCTTTCACTCTCACTGCACCC 
. . . HeProMETAlaLeuProTyrHisIlePheLeuPheThrValLeuLeuProSerPheThrLeuThrAlaPro 
LysSerProTrpProSerLeuIlellePhePheSerLeuLeuPhePheTyrProLeuSerLeuSerLeuHisPro 
AsnProHisGlyProProLeuSerTyrPheSerLeuTyrCysSerPheThrLeuPheHisSerHisCysThrPro 

CCTCCATGCCGCTGTATGACCAGTAGCTCCCCTTACCAAGAGTTTCTATGGAGAATGCAGCGTCCCGGAAATATT 
ProProCvsArcrCvsMETThrSerSerSerProTyrGlnGluPheLeuTrpArcrMETGlnArq-ProGlvAsnlie 
LeuHisAlaAlaVal . . . ProValAlaProLeuThrLysSerPheTyrGlyGluCysSerValProGluIleLeu 
SerMETProLeuTyrAspGln. . . LeuProLeuProArgValSerMETGluAsnAlaAlaSerArgLysTyr . . . 

GATGCCCCATCGTATAGGAGTCTTTCTAAGGGAACCCCCACCTTCACTGCCCACACCCATATGCCCCGCAACTGC 
AspAlaProSerTyrArgSerLeuSerLvsGlvThrProThrPheThrAlaHisThrHisMETProArQAsnCvs 
METProHisArglleGlyValPheLeuArgGluProProProSerLeuProThrProIleCysProAlaThrAla 
CysProIleVal . . . GluSerPhe. . . GlyAsnProHisLeuHisCysProHisProTyrAlaProGlnLeuLeu 

TATCACTCTGCCACTCTTTGCATGCATGCAAATACTCATTATTGGACAGGAAAAATGATTAATCCTAGTTGTCCT 
TvrHisSerAlaThrLeuCysMETHisAlaAsnThrHisTvrTrpThrGlvLvsMETIleAsnProSerCvsPro 
IleThrLeuProLeuPheAlaCysMETGlnlleLeuIlelleGlyGlnGluLys . . .LeuIleLeuValValLeu 
SerLeuCysHisSerLeuHisAlaCysLysTyrSerLeuLeuAspArgLysAsnAsp . . .Ser. . .LeuSerTrp 

GGAGGACTTGGAGTCACTGTCTGTTGGACTTACTTCACCCAAACTGGTATGTCTGATGGGGGTGGAGTTCAAGAT 
GlvGlvLeuGlvValThrValCvsTrpThrTvrPheThrGlnThrGlvMETSerAspGlyGlyGlyValGliiAsp 
GluAspLeuGluSerLeuSerValGlyLeuThrSerProLysLeuValCysLeuMETGlyValGluPheLysIle 
ArgThrTrpSerHisCysLeuLeiiAspLeuLeuHisProAsnTrpTyrVal . . . TrpGlyTrpSerSerArgSer 

CAGGCAAGAGAAAAACATGTAAAAGAAGTAATCTCCCAACTCACCCGGGTACATGGCACCTCTAGCCCCTACAAA 
GlnAlaArcrGluIiysHisValLysGluVallleSerGlnLeuThrAraValHisGlyThrSerSerProTyrLys 
ArgGlnGluLysAsnMET . . . LysLys . . . SerProAsnSerProGlyTyrMETAlaProLeuAlaProThrLys 
GlyLysArgLysThrCysLysArgSerAsnLeuProThrHisProGlyThrTrpHisLeu. . . ProLeuGlnArg 

GGACTAGATCTCTCAAAACTACATGAAACCCTCCGTACCCATACTCGCCTGGTAAGCCTATTTAATACCACCCTC 
GlyLexxAspLeuSerLysLeuHisGluThrLeuArcrThrHisThrArcrLeuValSerLeuPheAsnThrThrLeu 
Asp. . . IleSerGlnAsnTyrMETLysProSerValProIleLeuAlaTrp. . . AlaTyrLeuIleProProSer 
ThrArgSerLeuLysThrThr . . . AsnProProTyrProTyrSerProGlyLysProIle . . . TyrHisProHis 

ACTGGGCTCCATGAGGTCTCGGCCCAAAACCCTACTAACTGTTGGATATGCCTCCCCCTGAACTTCAGGCCATAT 
ThrGlyLetiHisGluValSerAlaGlnAsnProThrAsnCysTrpIleCysLeuProLeuAsnPheArcrProTyr 
LeuGlySerMETArgSerArgProLysThrLeuLeuThrValGlyTyrAlaSerPro . . . ThrSerGlyHisMET 
TrpAlaPro. . . GlyLeuGlyProLysProTyr . . . LeuLeuAspMETProProProGluLeuGlnAlalleCys 

GTTTCAATCCCTGTACCTGAACAATGGAACAACTTCAGCACAGAAATAAACACCACTTCCGTTTTAGTAGGACCT 
ValSerlleProValProGluGlnTrpAsnAsnPheSerThrGluIleAsnThrThrSerValLeuValGlyPro 

PheGlnSerLeuTyrLeuAsnAsnGlyThrThrSerAlaGlnLys . . . ThrProLeuProPhe AspLeu 

PheAsnProCysThr . . . ThrMETGluGlnLeuGlnHisArgAsnLysHisHisPheArgPheSerArgThrSer 
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CTTGTTTCCAATCTGGAAATAACCCATACCTCAAACCTCACCTGTGTAAAATTTAGCAATACTACATACACAACC 
LeuValSerAsnLeuGluIleThrHisThrSerAsnLeuThrCvsValLvsPheSerAsnThrThrTvrThrThr 
LeuPheProIleTrpLys . . . ProIleProGlnThrSerProVal . . .AsnLeuAlalleLeuHisThrGlnPro 
CysPheGlnSerGlyAsnAsnProTyrLeuLysProHisLeuCysLysIle . . . GlnTyrTyrlleHisAsnGln 



AACTCCCAATGCATCAGGTGGGTAACTCCTCCCACACAAATAGTCTGCCTACCCTCAGGAATATTTTTTGTCTGT 
AsnSerGlnCvsIleArqTrpValThrProProThrGlnlleValCvsLeuProSerGlvI lePhePheValCys 
ThrProAsnAlaSerGlyGly . . . LeuLeuProHisLys . . . SerAlaTyrProGlnGluTyrPheLeuSerVal 
LeuProMETHisGlnValGlyAsnSerSerHisThrAsnSerLeuProThrLeuArgAsnllePheCysLeuTrp 

GGTACCTCAGCCTATCGTTGTTTGAATGGCTCTTCAGAATCTATGTGCTTCCTCTCATTCTTAGTGCCCCCTATG 
GlvThrSerAlaTyrArcTCysLeuAsnGlvSerSerGluSerMETCvsPheLeuSerPheLeuValProProMET 
ValProGlnProIleValVal . . . METAlaLeuGlnAsnLeuCysAlaSerSerHisSer . . .CysProLeu. . . 
TyrLeuSerLeuSerLeuPheGluTrpLeuPheArglleTyrValLeuProLeuIleLeuSerAlaProTyrAsp 



ACCATCTACACTGAACAAGATTTATACAGTTATGTCATATCTAAGCCCCGCAACAAAAGAGTACCCATTCTTCCT 
ThrlleTvrThrGluGlnAspLeuTyrSerTvrVallleSerLysProArcrAsnLysArqValProIleLeuPro 
ProSerThrLeuAsnLysIleTyrThrValMETSerTyrLeuSerProAlaThrLysGluTyrProPhePheLeu 
HisLeuHis . . . ThrArgPhelleGlnLeuCysHisIle . . . AlaProGlnGlnLysSerThrHisSerSerPhe 

TTTGTTATAGGAGCAGGAGTGCTAGGTGCACTAGGTACTGGCATTGGCGGTATCACAACCTCTACTCAGTTCTAC 
PheVallleGlyAlaGlvValLeuGlvAlaLeuGlvThrGlvIleGlvGlvIleThrThrSerThrGlnPheTyr 
LeuLeu. . . GluGlnGluCys . . .ValHis. . . ValLeuAlaLeuAlaValSerGlnProLeuLeuSerSerThr 
CysTyrArgSerArgSerAlaArgCysThrArgTyrTrpHisTrpArgTyrHisAsnLeuTyrSerValLeuLeu 

TACAAACTATCTCAAGAACTAAATGGGGACATGGAACGGGTCGCCGACTCCCTGGTCACCTTGCAAGATCAACTT 
TyrLysLeuSerGlnGluLeiiAsnGlyAspMETGluArcrValAlaAspSerLeuValThrLeuGlnAspGlnLeu 
ThrAsnTyrLeuLysAsn. . . METGlyThrTrpAsnGlySerProThrProTrpSerProCysLysIleAsnLeu 
GlnThrlleSerArgThrLysTrpGlyHisGlyThrGlyArgArgLeuProGlyHisLeuAlaArgSerThr . . . 

AACTCCCTAGCAGCAGTAGTCCTTCAAAATCGAAGAGCTTTAGACTTGCTAACCGCTGAAAGAGGGGGAACCTGT 
AsnSerLeuAlaAlaValValLeuGlrLAsnAraArcrAlaLeiiAsuLeuLeuThrAlaGluArQGlyGlyThrCys 
ThrPro. . .GlnGln. . . SerPheLysIleGluGluLeu . . . ThrCys . . . ProLeuLysGluGlyGluProVal 
LeuProSerSerSerSerProSerLysSerLysSerPheArgLeuAlaAsnArg . . . LysArgGlyAsnLeuPhe 

TTATTTTTAGGGGAAGAATGCTGTTATTATGTTAATCAATCCGGAATCGTCACTGAGAAAGTTAAAGAAATTCGA 
LeuPheLeuGlyGluGluCysCysTyrTyrValAsnGlnSerGlylleValThrGluLysValLysGluIleArq 
TyrPhe . . . GlyLysAsnAlaVal IleMETLeuIleAsnProGluSerSerLeuArgLysLeuLysLysPheGlu 
IlePheArgGlyArgMETLeuLeuLeuCys . . . SerlleArgAsnArgHis . . . GluSer. . . ArgAsnSerArg 

GATCGAATACAACGTAGAGCAGAGGAGCTTCGAAACACTGGACCCTGGGGCCTCCTCAGCCAATGGATGCCCTGG 
AspArcrlleGlnAraAraAlaGluGluLeuArcTAsnThrGlyProTrpGlyLeuLeuSerGlnTrpMETProTrp 
IleGluTyrAsnValGluGlnArgSerPheGluThrLeuAspProGlyAlaSerSerAlaAsnGlyCysProGly 
SerAsnThrThr . . . SerArgGlyAlaSerLysHisTrpThrLeuGlyProProGlnProMETAspAlaLeuAsp 

ATTCTCCCCTTCTTAGGACCTCTAGCAGCTATAATATTGCTACTCCTCTTTGGACCCTGTATCTTTAACCTCCTT 
IleLeuProPheLeuGlyProLenAlaAlallelleLeuLeuLeuLeuPheGlyProCysIlePheAsriLeuLeu 
PheSerProSer . . .AspLeu. . .GlnLeu. . . TyrCysTyrSerSerLeuAspProValSerLeuThrSerLeu 
SerProLeuLeuArgThrSerSerSerTyrAsnlleAlaThrProLeuTrpThrLeuTyrLeu . . . ProProCys 
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GTTAA.CTTTGTCTCTTCCAGAATCGAAGCTGTAAAACTACAAATGGAGCCCAAGATGCAGTCCAAGACTAAGATC 
ValAsnPheValSerSerArcrlleGluAlaValLvsLeuGlnMETGluProLvsMETGlnSerLvsThrLvsIle 
LeuThrLeuSerLeuProGluSerLysLeu . . . AsnTyrLysTrpSerProArgCysSerProArgLeuArgSer 
. . . LeuCysLeuPheGlnAsnArgSerCysLysThrThrAsnGlyAlaGlnAspAlaValGlnAsp . . . AspLeu 

TACCGCAGACCCCTGGACCGGCCTGCTAGCCCACGATCTGATGTTAATGACATCAAAGGCACCCCTCCTGAGGAA 
TyrArcrArcrProLeuAspArcrProAlaSerProArcrSerAspValAsnAspIleLvsGlvThrProProGluGlu 
ThrAlaAspProTrpThrGlyLeuLeuAlaHisAspLeuMETLeuMETThrSerLysAlaProLeuLeuArgLys 
ProGlnThrProGlyProAlaCys . . . ProThrlle. . . Cys HisGlnArgHisProSer . . .GlyAsn 



ATCTCAGCTGCACAACCTCTACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGCGGTCGTCGGCCAACCTCCCCA 
IleSerAlaAlaGlnProLeuLeuArcrProAsnSerAlaGlvSerSer . . . SerGlyArgArgProThrSerPro 
SerGlnLeuHisAsnLeuTyrTyrAlaProIleGlnGlnGluAlaValArgAlaValValGlyGlnProProGln 
LeuSerCysThrThrSerThrThrProGlnPheSerArgLysGlnLeuGluArgSerSerAlaAsnLeuProAsn 

ACAGCACTTAGGTTTTCCTGTTGAGATGGGGG 
ThrAlaLeuArgPheSerCys . . . AspGlyGly 
GlnHisLeuGlyPheProValGluMETGly 
SerThr. . . ValPheLeuLeuArgTrpGly 
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LysLeuLeuGlnGluAsnLysGluGlnAlalleThrLeuGluLysThrGlyAsn . . . PheTyrProGlnAIaGln 
ThrSerGlylleSerValSerThrSerLeuGlyArgTyrPheHisGlyLeuGlyArgGlyLeuProLeu. . .Asp 
ArgLysGlyProArgGlyAsnLysGlyThrSerSer . . . AsnAsnSerGlnlleArgThrSerProArgLeuThr 
Glu. . .Gin. . . ProCysPheProGlyHisSerAsnProGlySerlleProGlyValArgTyrThrlleSerLeu 
ThrLeuArgLeuLysAlaThrValLeuArgGluGlyArgGluAsnGlu. . . AsnThrGlnArgThrSerLysLys 

AlaAsnProGlyAsnProProHisMETAlaCysSerValAlaTyrSerLeuLysLysAsnLeuGlnLeuSerPro 
LysSerArgThr . . . ProIleArgAsnAlaValTrpLysAlaLeuHisAsnGln . . . ProCysAla . . . ProLys 
ThrAlaAsnLeuValAlaAspIleThrSerLeuAlaLysTyrGlnGlnValLeuLysThrLeuGlnGlyThrTyr 
Pro . . . GluGluGlyLysGluLeuPheHisProCysAspMETValLeuValLysSerLeuProSerAsnSerPro 
SerLeuAspThrSerTrpGluGlyProTyrProVallleLeuSerThrProThrAlaValLysValAlaGIyVal 
GluSerTrpIleHisHisThr . . . ValLysSerTrpIleLeuProLysGluProGluAsnProGlyAspAsnAla 
SerTyrSerCysGluProLeuGluAspLeuArgLeuLeuPheLysGlnGlnProGlyGlyLys . . . LeuLysSer 
. . . HeProMETAlaLeuProTyrHisIlePheLeuPheThrValLeuLeuProSerPheThrLeuThrAlaPro 
ProProCysArgCysMETThrSerSerSerProTyrGlnGluPheLeuTrpArgMETGlnArgProGlyAsnlle 
AspAlaProSerTyrArgSerLeuSerLysGlyThrProThrPheThrAlaHisThrHisMETProArgAsnCys 
TyrHisSerAlaThrLeuCysMETHisAlaAsnThrHisTyrTrpThrGlyLysMETIleAsnProSerCysPro 
GlyGlyLeuGlyValThrValCysTrpThrTyrPheThrGlnThrGlyMETSerAspGlyGlyGlyValGlnAsp 
GlnAlaArgGluLysHisValLysGluVallleSerGlnLeuThrArgValHisGlyThrSerSerProTyrLys 
GlyLeuAspLeuSerLysLeuHisGluThrLeuArgThrHisThrArgLeuValSerLeuPheAsnThrThrLeu 
ThrGlyLeuHisGluValSerAlaGlnAsnProThrAsnCysTrpIleCysLeuProLeuAsnPheArgProTyr 
ValSerlleProValProGluGlnTrpAsnAsnPheSerThrGluIleAsnThrThrSerValLeuValGlyPro 
LeuValSerAsnLeuGluIleThrHisThrSerAsnLeuThrCysValLysPheSerAsnThrThrTyrThrThr 
AsnSerGlnCysIleArgTrpValThrProProThrGlnlleValCysLeuProSerGlyllePhePheValCys 
GlyThrSerAlaTyrArgCysLeuAsnGlySerSerGluSerMETCysPheLeuSerPheLeuValProProMET 
ThrlleTyrThrGluGlnAspLeuTyrSerTyrVallleSerLysProArgAsnLysArgValProIleLeuPro 
PheVallleGlyAlaGlyValLeuGlyAlaLeuGlyThrGlylleGlyGlylleThrThrSerThrGlnPheTyr 
TyrLysLeuSerGlnGluLeuAsnGlyAspMETGluArgValAlaAspSerLeuValThrLeuGlnAspGlnLeu 
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AsnSerLeuAlaAlaValValLeuGlnAsnArgArgAlaLeuAspLeuLeuThrAlaGluArgGlyGIyThrCys 
LeuPheLeuGlyGluGluCysCysTyrTyrValAsnGlnSerGlylleValThrGluLysValLysGiuIleArg 
AspArglleGlnArgArgAlaGluGluLeuArgAsnThrGlyProTrpGlyLeuLeuSerGlnTrpMETProTrp 
IleLeuProPheLeuGlyProLeuAlaAlallelleLeuLeuLeuLeuPheGlyProCysIlePheAsnLeuLeu 
ValAsnPheValSerSerArglleGluAlaValLysLeuGlnMETGluProLysMETGlnSerLysThrLysIle 
TyrArgArgProLeuAspArgProAlaSerProArgSerAspValAsnAspIleLysGlyThrProProGluGlu 
IleSerAlaAlaGlnProLeuLeuArgProAsnSerAlaGlySerSer . . . SsrGlyArgArgProThrSerPro 
ThrAlaLeuArgPheSerCys . . . AspGlyGly 
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SerSerPheArgArgThrLysAsnArgProLeuProTrpArgArgLeuAlaThrAspPheThrHisLysProLys 
ProGlnGlyPheGlnTyrLeuLeuValTrpValAspThrPheThrGlyTrpAlaGluAlaPheProCysArgThr 
GluLysAlaGlnGluVallleLysAlaLeuValHisGluIlelleProArgPheGlyLeuProArgGlyLeuGln 
SerAspAsnSerProAlaPheGlnAlaThrValThrGlnGlyValSerGlnAlaLeuGlylleArgTyrHisLeu 
HisCysAla . . . ArgProGlnSerSerGlyLysValGluLysMETAsnGluThrLeuLysGlyHisLeuLysLys 
GlnThrGlnGluThrHisLeuThrTrpProAlaLeuLeuProIleAlaLeuLysArglleCysAsnPheProGln 
LysAlaGlyLeuSerProTyrGluMETLeuTyrGlyArgProPhelleThrAsnAspLeuValLeuAspProArg 
GlnProThr. . . LeuGlnThrSer ProPro . . . ProAsnlleAsnLysPheLeuLysHisTyrLysGluProIle 
ProGluLysArgGluLysAsnTyrSerThrLeuValThrTrpTyr . . . SerSerProPheProLeuIleProHis 
Pro . . . IleHisProGlyLysAspProThrGlnSerPheTyrLeuProGlnLeuArgLeuLysTrpLeuGluTrp 
SerLeuGlyTyrlleThrLeuGluSerAsnProGlyTyrCysGlnArgAsnLeuLysIleGlnGluThrThrLeu 
AlalleProValAsnLeu. . . ArglleCysAlaCysSerSerAsnAsnAsnGlnGluGluSerAsn . . .AsnHis 
LysSerProTrpProSerLeuIlellePhePheSerLeuLeuPhePheTyrProLeuSerLeuSerLeuHisPro 
LeuHisAlaAlaVal . . . ProValAlaProLeuThrLysSer PheTyrGlyGluCysSerValProGluI leLeu 
METProHisArglleGlyValPheLeuArgGluProProProSerLeuProThrProIleCysProAlaThrAla 
IleThrLeuProLeuPheAlaCysMETGlnlleLeuIlelleGlyGlnGluLys . . . LeuIleLeuValValLeu 
GluAspLeuGluSerLeuSerValGlyLeuThrSerProLysLeuValCysLeuMETGlyValGluPheLysIle 
ArgGlnGluLysAsnMET. . .LysLys. . . SerProAsnSer ProGlyTyrMETAIaProLeuAlaProThrLys 
Asp. . . IleSerGlnAsnTyrMETLysProSerValProIleLeuAlaTrp . . . AlaTyrLeuIleProProSer 
LeuGlySerMETArgSerArgProLysThrLeuLeuThrValGlyTyrAIaSerPro . . . ThrSerGlyHisMET 

PheGlnSerLeuTyrLeuAsnAsnGlyThrThrSerAlaGlnLys . . . Thr ProLeuProPhe AspLeu 

LeuPheProIleTrpLys . . . ProIleProGlnThrSer ProVal . . . AsnLeuAlal leLeuHisThrGInPro 
ThrProAsnAlaSerGlyGly . . . LeuLeuProHisLys . . . SerAlaTyrProGlnGluTyrPheLeuSerVal 
ValProGlnProIleValVal . . . METAlaLeuGlnAsnLeuCysAlaSerSerHisSer . . .CysProLeu. . . 
ProSerThrLeuAsnLysIleTyrThrValMETSerTyrLeuSerProAlaThrLysGluTyrProPhePheLeu 
LeuLeu. . . GluGlnGluCys . . . ValHis. . . ValLeuAlaLeuAlaValSerGlnProLeuLeuSerSerThr 
ThrAsnTyrLeuLysAsn. . . METGlyThrTrpAsnGlySerProThrProTrpSerProCysLysIleAsnLeu 
ThrPro. . .GlnGln. . . SerPheLysIleGluGluLeu . . . ThrCys . . . ProLeuLysGluGlyGluProVal 
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TyrPhe . . . GlyLysAsnAlaVal IleMETLeuIleAsnProGluSerSerLeuArgLysLeuLysLys PheGlu 
IleGluTyrAsnValGluGlnArgSerPheGluThrLeuAspProGlyAlaSerSerAlaAsnGlyCysProGly 
PheSerProSer . . .AspLeu. . .GlnLeu. . . TyrCysTyrSerSerLeuAspProValSerLeuThrSerLeu 
LeuThrLeuSerLeuProGluSerLysLeu. . . AsnTyrLysTrpSerProArgCysSerProArgLeuArgSer 
ThrAlaAspProTrpThrGlyLeuLeuAlaHisAspLeuMETLeuMETThrSerLysAlaProLeuLeuArgLys 
SerGlnLeuHisAsnLeuTyrTyrAlaProIleGlnGlnGluAlaValArgAlaValValGlyGlnProProGln 
GlnHisLeuGlyPheProValGluMETGly 
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AlaProSerGlyGluGlnArgThrGlyHisTyrProGlyGluAspTrpGlnLeuIleLeuProThrSerPrcAsn 
LeuArgAspPheSerlleTyr . . . SerGly. . . IleLeuSerArgValGlyGlnArgProSerProValGlyGln 

LysArgProLysArg ArgHis . . . PheMETLys . . . PheProAspSerAspPheProGiuAlaTyrArg 

ValThrlleAlaLeuLeuSerArgProGln . . . ProArgGluTyrProArgArg . . . ValTyrAspIleThrTyr 
ThrAlaProGluGlyHisSerProGlnGlyArgSerArgLys . . . METLysHisSerLysAspIle . . . LysSer 
LysProArgLysProThrSerHisGlyLeuLeuCysCysLeu . . .Pro. . . LysGluSerAlaThrPheProLys 
LysGlnAspLeuAlaHisThrLysCysCysMETGluGlyProSer . . . ProMETThrLeuCysLeuThrGlnAsp 
SerGlnLeuSerCysArgHisHisLeuLeuSerGlnlleSerThrSerSer . . . AsnlleThrArgAsnLeuSer 
LeuArgArgGlyLysArgThrlleProProLeu. . . HisGlylleSerGInValProSerLeu . . . PheProIle 
ProArgTyrlleLeuGlyArgThrLeuProSerHisPhelleTyrProAsnCysGly . . . SerGiyTrpSerGly 
ValLeuAspThrSerHisLeuSerGlnlleLeuAspThrAlaLysGlyThr . . . LysSerArgArgGlnArg . . . 
LeuPheLeu . . . ThrSerArgGlyPheAlaProAlaLeuGlnThrThrThrArgArgLysValThrLysIlelle 
AsnProHisGlyProProLeuSerTyrPheSerLeuTyrCysSerPheThrLeuPheHisSerHisCysThrPro 
SerMETProLeuTyrAspGln. . . LeuProLeuProArgValSerMETGluAsnAlaAlaSerArgLysTyr . . . 
CysProIleVal . . . GluSerPhe. . . GlyAsnProHisLeuHisCysProHisProTyrAlaProGlnLeuLeu 
SerLeuCysHisSerLeuHisAlaCysLysTyrSerLeuLeuAspArgLysAsnAsp . . . Ser. . . LeuSerTrp 
ArgThrTrpSerHisCysLeuLeuAspLeuLeuHisProAsnTrpTyrVal . . . TrpGlyTrpSerSerArgSer 
GlyLysArgLysThrCysLysArgSerAsnLeuProThrHisProGlyThrTrpHisLeu . . . ProLeuGlnArg 
ThrArgSerLeuLysThrThr . . . AsnProProTyrProTyrSerProGIyLysProIle . . . TyrHisProHis 
TrpAlaPro. . . GlyLeuGlyProLysProTyr . . . LeuLeuAspMETProProProGluLeuGlnAlalleCys 
PheAsnProCysThr . . . ThrMETGluGlnLeuGlnHisArgAsnLysHisHisPheArgPheSerArgThrSer 
CysPheGlnSerGlyAsnAsnProTyrLeuLysProHisLeuCysLysIle . . . GlnTyrTyrlleHisAsnGln 
LeuProMETHisGlnValGlyAsnSerSerHisThrAsnSerLeuProThrLeuArgAsnllePheCysLeuTrp 
TyrLeuSerLeuSerLeuPheGluTrpLeuPheArglleTyrValLeuProLeuIleLeuSerAlaProTyrAsp 
HisLeuHis. . . ThrArgPhelleGlnLeuCysHisIle . . . AlaProGlnGlnLysSerThrHisSerSer Phe 
CysTyrArgSerArgSerAlaArgCysThrArgTyrTrpHisTrpArgTyrHisAsnLeuTyrSerValLeuLeu 
GlnThrlleSerArgThrLysTrpGlyHisGlyThrGlyArgArgLeuProGlyHisLeuAlaArgSerThr . . . 
LeuProSerSerSerSerProSerLysSerLysSerPheArgLeuAlaAsnArg . . . LysArgGlyAsnLeuPhe 
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IlePheArgGlyArgMETLeuLeuLeuCys . . . SerlleArgAsnArgHis . . .GluSer. . . ArgAsnSerArc 
SerAsnThrThr . . . SerArgGlyAlaSerLysHisTrpThrLeuGlyProProGlnProMETAspAiaLeuAsp 
SerProLeuLeuArgThrSerSerSerTyrAsnlleAlaThrProLeuTrpThrLeuTyrLeu. . . ProProCys 
. . .LeuCysLeuPheGlnAsnArgSerCysLysThrThrAsnGlyAlaGlnAspAlaValGlnAsp. . .AspLeu 

ProGlnThrProGlyProAlaCys . . .ProThrlle. . . Cys HisGlnArgHis ProSer . . .GlyAsn 

LeuSerCysThrThrSerThrThrProGlnPheSerArgLysGlnLeuGluArgSerSerAlaAsnLeuProAsn 
SerThr. . . ValPheLeuLeuArgTrpGly 
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TTGGT CTTAAGAAC AC AAATG ATATGGCT C C AATG ACTGG AGGAAC AC C AGGGT C CTTGG 
TCTCACGCTGATTTAGATAAAACGAC TGTCAGGCCTCTGAGCCCAAGCTAAGCCATCCTC 
CCCTGTGACCTGCACGTATACATCCAGATGGCCTGAAGTAACCAAAGAATCACAAAAGCA 
GTGAAAATGGCCTGTTCCTGCCTTAACTGATGACATTCCACCATTGTGATTTGTTCCTGC 
CCCATCTTAACTGAGCGATTAACCTTGTGAAATTCCTTCTCCTGGCTCAAAACCTCCCCC 
ACTGAGCACCTTGTGACCCCCGCCCCTGCCCCTAAGAGAAAACCCCCTTTGATTATAATT 
TTCCACTACCCACCCAAATCCTATAAAATGGCCCCACCCCTATCTCCCTTCGCTGACTCC 
TTTTTCGGACTCAGCCCGCCTGCACCCAGGTGAAATAAACAGCCTTGTTGCTCACACAAA 
GCCTGTTTGGTGGACTCTCTTCACACGGACGCTCATGACATTTGGTGCCAAAACCTGGGA 
TAGGAGGACTCCTTCAGGAGACCAGTCCCCTGTCCTTGCCCTCACTCTGTGAGGACATCC 
ACCTACAACCTTGGGTCCTCAGACCAACCAGCCCAAGGAACAGCTCACCAATTTCAAATC 
AGGTAAGCAGTCTTTTCACTCTCTTCTCCAGCCTCTCTTGCTACCCTTCAAACTCCCTCT 
CTCACTACCCTTCAATCTCCCTGTCCTTCCAATTCCAGTTCTTTTTCATCTCTAGTAGAG 
ACAAAGGAGACACATTTTATCCATGGACCCAAAACTCCAGCACCAGTCACGGACTTGGGA 
AGACAGTCTTCCCTTGGTGTTTAATCACTGCGGGGACGCCTGCCTGATTATTCACCCACA 
CTCCATTGGTGTCTGATCACGGTGGGGACACCTGCCTTGGTCACTCACCCACATTCCCTT 
GGTGGTACGTCAACTGCAAAAGCAGGGGACGCCTGCTTTGGCTGCTCACCCACCCCCTTC 
TCTGTGTCTCTACCTTTCTCTTTAAACTTACCTCCTTCACTATGGGCAAACTTCTGCCCT 
CCATTCCCCCTTCTTCTCCCTTAGCCTGTGTTCTTAAAAACCTAAAACCTCTTCAACTCA 
CACCTGACCTAAAACCTAAATGCCTTATTTTCTTCTGCAACACTGCGTGGCTGCAGTACA 
AACTTGATAATAGCTTTAAATGGCCAGAATATGGCACTTTCAATTTCTCCATCCTACAAG 
ATCTAGATAATTTTTGTGGAAAAATGGAAAAATGGTCTGAGATGCCTGACGTCCAGGCAT 
TCTTTTACACATTGGTCCCTCCCTAGTCTCTGCTCCCAATGCGACTCATCCCAAATCTTT 
CTTCTTTCTCTCCTGTCTGTTCCTTCAGTCTCCACCCCAAGCTCTGAGTCCTTTGAATCC 
TCCTTTGCTACAGACCCATCTGAACTCTCCCCTCCTCCCCAGGCTGCTCCTCACCAGGCC 
GAGCCAGGTCCCAATTCTTCCTCAGCCTCTGCTCCCCCACCCTATAATCCTTTTATCACC 
TCCTCTCCTCACACTCAGTCCGGCTTACAGTTTCGTTCTGTGACTAGCCCTCCCCCATCT 
GCCCAACAATTTCCTCTTAAAGAGGTGGCTGGAGCTAAAGGCATAGTCAAGGTTAATGCT 
CCTTTTTCTTTATCTGACCTCTCCCAAATCAGTTAGCGTTTACGCTCTTTTTCATCAAAT 
ATAAAAACCCAGCCAGTTCATGGCCCATCTGGCAACAACCCTTACAGGCTTTACAGCCCT 
AGACCCTGAAGGGTCAGAAGGCCGTCTTATTCTCAATATGCATTTTATTACCCAATCCGC 
TCCCAAGA.TTAAATAAAGCTCCAAAAATTAAATTCTGGCCCTCAAACCCCACAACAGGAC 
TTAATTAACCTCACTTCAAGGTGTACAAGAATAGAGTAGAGGCAGCCAAGTAGCAACGTA 
TTTGAGTTG CAATTCCTTGC CTCAACT CTGAGAGAAAC C C C AGCC AC AT CT C CAGCAAAC 
AAGAACTTCAAAACACCTGAACTGCAGCAGCCAGGCGTTCCTCCAGGACCACCTCCCCCA 
GGATCTTGCTTCAAGTGCCGGAAATCTGACCATTGGGCCAAGGAATGCCTGCAGCCCAGG 
ATTCCTCCTAAGCCACGTCCCATTTGTGCAGGACCCCACTGGAAATCGGACTGTCCAACT 
CACCCGGCAGCCAATCCCAGAGCCCCTGGAACTCTGGCCCAAGGCTCTCTGACTGACTCC 
TTCCCAGATCTTCTCGGCTTAGCAGCTGAAGACTGACACTGCCCGATCACTTCAGAAGTC 
CCCTGGACCATCACGGATACTGAGCTTCAGGTAACTCTCACAGTGGAGGCTAAGTCCATC 
CCCTGTTTAATCGATACAGGGGCTACCCACTCCACATCACCTTCTTTTCAAGGGCCTGTT 
TCCCTTTCCCCCATAACTGTTGTGGGTATTGACGGCCAAGCTTCAAAACCCCTTAAAACT 
CCCCCACTCTGGTGCCAACTTGGACAACATTCTTTTATGCACTCTTTTTCAGTTATCCTC 
ACCTGCCCAGTTCCCTTATTAGGCCGAGACATTTTAACCAAATTATCTGCTTCCCCGACT 
ATTCCTGGGCTACAGCCACATCTCCTTGCCGCCCTTCTTCCCAACCCAAAGCCTCCTTCA 
TATCTTCCTCTCATATCCCCCCACCTTAACCCACAAGTATGGGACACCTCTACTCCCTCC 
CTGGCAACCGATCACACGCCCATTACTATCCCATTAAAACCTAATCACCCTTACCCTGCT 
CAATGCCAGTATCCCATACCACAACAGGCTTTAAAGGGATTGAAGCCTGTTATCACTTGC 



FIGURE 22.1 



WO 99/67395 PCT/FR99/01513 

52/64 

CTGCTACAGCACGGGCTTCTAAAACCTATAAACTCTCCATACAATTCCCCCATTTTACCT 
GTCTAAAAACCAGATAAGTCTTACAGGTTAGTTCAGAATCTGCACCTTATCAACCAAATT 
GTTTTGCCTATCCACCCTGTAGCACCCAACTCGTACACTCTTTTGTCCTCAATGCCTTCC 
CCCACAACTCACTATTCCGTTCTTGATCTTAAAGATGCTTTTTTCACTATTCCCCTGCAC 
CCCTCATCCCAGCCTCTCTTTGCTTTTACCTGGACTGACCCTGACACCCATCAGTCCCAG 
CAGCTTACCTGGGCTGTACTGCCGCAAGGCTTCAGGGACAGCCCTCATTACTTCAGCCAA 
GCTCTTTCTCATGATTTACTTTCTTTCCACCTCTCTGCTTCTCACCTTATTCAATATATT 
GATGACCTTCTACTTTGTAGCCCCTCCTTTAAATCTTCTCAACAAGACACCCTCCTGCTC 
CTTCAACATTTGTTCTCCAAAGGATATCGGGTATCCCCCTCCAAAGCTCAAATTTCTTCT 
CCATCTGTTACATACCTCGGCATAATTCTTCATGAAAACACATGTGCTCTCCCTGCCAAT 
TGCGTCTCCAACTGATCTCTCAAATCCCAACCTCTTCTACAAAACAACAACTCCTTTCCC 
TCCTAGGCATGGTTGGATACTTTTGCCTTTGGATACCTGGTTTTGCCATCCTAACAAAAT 
CATT ATATAAACT CAC AAAAGGAAACCTAGCTGAC C C CAT AGATT CT AAAT C CTTT C C C C 
ACTCCTCTTTCCATTCCTTGAAGACAGCTTTAGAGACTGCTCCCACACTAGCTCTCCCTG 
TCTCATCCCAACCCTTTTCATTACACACAGCCGAAGTGCAGGGCTGTGCAGTCGGAATTC 
TTACACAAGGACCGGGACCATGCCCTGTAGCCTTTTTGTCCAAACAACTTGACCTTACTG 
TTTTAGGCTCGCCATCATGTCTCCATGCGGTAGCTTCCGCTGCCCTAATACTTTTAGAGG 
CCCTCAAAATCACAAACTATGCTCAACTCACTCTCTACAGCTCTCACAACTTCCAAAATC 
TATTTTCTTTCTCACACCTGACGCATATACTTTCTGCTCCCCGGCTCCTTCAGCTGTATT 
CACTCTTTGTTGAGTCTCCCACAATTACCATTCTTCCTGGCCCAGACTTCAATCTGGCCT 
C CCAC ATT ATT CTGGATACCACACCTGAC C CTGATGATTGT ATGT CT CTGAT CTAC CTGA 
CATTCACCCCATTTCCCCATATTTCCTTCTTTTCTGTTCCTCATGTTGATCACATTTGGT 
TTACTGACGGCAGTTCCACCAGGCCTGATCGCCACTCACCAGCAAAGGCAGGCTATGCTA 
TAGAATCTTCCACATCCATCATTGAGGCTACTGCTCTGCCCCCCTCCACTACCTCTCAGC 
AAGCCGAACTGATTGCCTTAACTCGGGCCTTCACTCTTGCAAAGGGACTACACGTCAATA 
TTTATACTGACTCTAAATATGCCTTCCATATCTTGCACCACCATGCTGTTATATGGGCTG 
AAAGAGGTTTCCTCACTACGCAAGGGTCCTC CAT CATTAATGCCT CTTT AATAAAAACTC 
TTCTCAAGGCTGCTTTACTTCCAAAGGAAGCTGGAGTCACACACTGCAAGGGCCACCAAA 
AGGCGTCAGATCCCATTACTCTAGGAAATGCTTATGCTGATAAGGTAGCTAAAGAAGCAC 
CTAGCGTTCCAACTTCTGTCCCTCATGGCCAGTTTTTCTCCTTCCCATCAGTCATTCCCA 
CCTACTCCCCCATTGAAACTTCCGCCTATCAATCTCTTCTCACACAAGGCAAATGGTTCT 
TAGACCAAGGAAAATATCTCCTTCCAGCCTCACAGGCCCATTCTATTCTGTCATCATTTC 
ATAACCTCTTCCATGTAGGTTACAAGCCACTAGTCCACCTCTTAGAACCTCTCATTTCCT 
TCCATCGTGGAAACATATCCTCAAGGAAATCACTTCTCAGTGTTCCATCTGCT ATT CTAC 
TACCCCTCAGGGATTGTTCAGGCCCCCTCCCCTCCCTACACATCAAGCTCGGGGATTTGC 
CCCTGCCCAGGACTGGCAAATTGACTTTACTCACATGCCCTGAGTCAGGAAACTAAAATA 
CCTCTTGGTCTGGGTAGACACTGTCACTGGATGGGTAGAGGCCTTTCCCACAGGGTCTGA 
GAAGGCCACTGCAGTCATTTCTTCCCTTCTGTCAGACATAATTCCTTGGGTTGGCCTTCC 
CACCTCTATACAGTCCAATAACGGAGCAGCCTTTATTAGTCAAATCACCTGAGCAGTTTT 
TCAGGCTCTTGGTATTCAGTGGAACCTTCGTACCCCTTACTGTCCTCAATCTTCAGGAAA 
GGTAGAATGGACTAATGGTCTTTTAAAAACACACCCCACCAAACTCAGCCTCCAACTTAA 
AAAGGAGGATAGAGCCCAAAAACTCGCAACCAAGCTAGTAATTATGCTGAACCCCCTTGG 
GCACTCTCTAATTGGATGTCTTAGGTCCTCCCAAATCTTAGTCCTTTAATATCTGTTTTT 
CTCCTTCTCTTATTCGGACCTTGTGTCTTCCGTTTAGTTTTTCAATTCATACAAAACCGC 
AT C C AGGC CAT CAC C AAT CGTT CT AT AC AATAAATGCT C C TT CT AAC AAC C C C AC AAT AT 
CGCCCCTTACCACAAAATCTTCCTTCAGCTTAATCTCTCCCACTCTAGGTTCCCATGCCG 
CCCATAATCCCTCTCGAAGCAGCCCTGAGAAACATAGCCCATTATCTCTCCATACCACCC 
CCAAAATTTTTGCTGCCCCAACACTTCAACACTATTTTACATTATTTTTCTTATTAATAT 
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AAGAAGACAGCAATGTCAGGCCTCTGAGCCCAAGCCATCATATCCCCTGTGACCTGCACA 
TATACATCCAGATGGCCTGAAGTAACTGAAGAATCACAAAAGAAGTGAAAATGGCCTGTT 
CCTGCCTTAACCGATGACATTCCACCACTGTGATTTGTTCCTGCCCCACCTTAACTGAGC 
AATTAACCTTGGGAAATTCCTTCTCCTGGCTCAAAACCTCCCCCACTGAGCACCTTGTGA 
CCCCTGCCCCTCCACTACCCACCCAAATCCTATAAAATGGCCCCACCCCATCTCCCTTAG 
CTGACTCCTTTTTTGGACTCAGCCCGCCTGCACCCAGGTGAAATAAACAGCCTTGTTGCT 
CACACAAAGCCTGTTTGGTGGACTCTCTTCACAGGGAC GGGGGTGACAACAACACGGACA 
CACATGGAGTGGTTTTAAGGAGCAGAGAGTTTAATACGCAAAAAAGAAGGAAGAGGCTCC 
CCTGTACAGACACAGAGGGAGGGGGCTCCAAGCCGAGAGAAGGAAACCCCATGTGCAGTG 
GAAAAGTGGTTGATTATACTGGGAGGCTGGAGGAGGCGGTGTCTGATTTGCACAGGGCCC 
AGGGGATTGGGTTGACCAGGTGTATCATTCATGTACCCCGCAAAAAACCTGGCCCTCCCA 
CCTCAGCCCTTTAATATGCAAATGTGGGTTGCCATGATGTTCTGAAAACACATGAATTAT 
CTGGAGGGGGCCATGACACTTGGTACATGTGCTGACAAGAAGAGGGTGGGAATCGCCATG 
GTGGCCATGTTGGGTGGACCTAGTTTTTAATAGCCTGCATTTGCATATCAAAGTTTGCTG 
GCCTGGCTCTTTAAGCTGTCTTTTCTGTTAGAAAAGGAATGGTTTGGAATGGGTGAGGGT 
TGCTTCTTATTACAAGAAAATTTCCAAAAACCTTTACTCTTTCTAGCTGCCAAAAAACTA 
TTTCTTAATAACTTATGTATTACCATAATTAGGCAGCACCAAAGATCCCTGCAGGTCAGA 
CCACTGCAATTAACATGCTGGCTTTACTGCTGATTATGGTAGCTGCATCCACCTAGCCTC 
TCATATTGCAACTGCCTGACCTCTGCCACCCCACGAGCCACTTATCCCCACTTATAATCA 
GCCCATTTCGATTGTAACATCTGCCACTTATTCCCGACGTTGTGGTATATCCTATAGATG 
AATTCATTCAACATCCATTCCAACACCACCTCTCTTGCCTTCCTATACTCTCTGGAGAGT 
GAATTACTGAGTCACATGATCTTCACTGCAGTCATTTGTGGCTATGTGACATAGTTCTGG 
ACAGTGAACATAGACAGAAGT CCCTGGGGCGGGCTTCCTTTCTGGGA TGAGGGCAAAACG 
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GATCTCTTGATCCCAGGAGGTCAAGGCTGCAATGAGCTAAGATCAAGCCACTGCATTCCA 
GCCTGAGTGATAGTGGGAGACCTTGTCTTTAAAACACACACACACACACACACACACACG 
AGGGCCTTTGACCACTCTTGAGTAGAAGACTCGAGAAGAACAAAGTAGAAGGCCAGAGAA 
GAACAAAGTTACTTGAAAGATCTCTTATTAAAGAGAATGTACAAGCTATGAAAAAAAAAA 
AACACACACACACACACAAACCTCATCTGGAATGAAAAAAACATAATGCATTTGGTTTCT 
GGTTCCTTAGGCTGTTATGGAACAACCAAAGAACATTATTTTGGTTTCTGAGGTCAGAAC 
TATTTTATTCCCCTCAAGCACACTATGCTTATGGTTTGAGGGAGAATGAGAAATAGGAAA 
CTAGGAACAGGCTGAAATGGTCTAATCTTGACCATCTAATTCTGCAGTGTCTTATTCTCA 
TTCTAAAAGAGAATGGTTATATTCGCTGTTCTAGCATAAAAAGTAATGATAAAAATAAAA 
GATCCCGTATTACCAGACAATAATCCCCTAGACTGTTTTAATGCTTGGTTGAGTATTTGC 
TTATGATCTCAGACTTTAAAAGATGGTCTCCCCCTATGGTGAAGCTTGTTAATTATGTAG 
GCATCATTAATGTCTGTTTACTTATCAAAATTTTATCATTGTTAGTTGTATTACTACTTG 
ACAGTCCAATTTATTTAATTGAAAAGATTGGTTAACATTTTATAGTCAAAGTAATTGTTT 
CCTGTGTTTTTTCCTGTTTAG GTTATTGGAGTGATGAGTAAAGAATACATACCAAAGGGC 
ACACGTTTTGGACCCCTAATAGGTGAAATCTACACGAATGACACAGTTCCTAAGAACGCC 
AACAGGAAATATTTTTGGAGG GTAAGTAAGGGAAATTTCTTCAGACCCATTAAATGTTAG 
GAAAAAATGGAGCTAAAAGAGCTGGGTGGCTCACCTTTCTCATCCTGTGCTGAGAAATGC 
TGGGGCTCACCCATAAGTATCCAGCATCCCCATGGACACAGGGAATTCTGAACAAATGTG 
ATGAAACCGATGAAATGTCTGGCCTGTAGGTGGTTAGTGATGGAGATACGGGCTATATGT 
GAATCTTGATTTTTGCAATTCATTAGAGCTTTGTAATGAAAGGAAACAGTTTGTTGCTTG 
CTTTAAGGATAGGTTCATTTGCATTTCTCCGCAAGGAAGTAGTAATGAGTTACCAAGCCT 
TAGATTTCACCCCTTTTTGATTTCTTGCTGACTTAACTTTAATTGAATGGAAGAGTTATC 
ACAAATGAATTATCTTTTTGGTTTTTTTTTTTTTGAGATGGAGTCTCACTCTGTCACCAG 
GCTGGAGTGCAATGGCATGATCTCGGCTCACTGCAACCTCCGCCTCCCAGGTTCAAGCAA 
TTGTCCTGCCTCAGCCTCCCGAGTAGCTGGGACTAAGGTGCGCGCCACCATGCCCAGTTA 
ATTTTTGTATTTTTAGTAGAGACGGGGTTCCACTATGTTGGCCATGATGGTCTCGATCTC 
TGGACCTCGTGATCCGCCCACCTTGGCCTCCCAAAGTGCTGGAATTACAGGCAAGAGCCA 
CCGCGCCCAGCCAGGAATGACAAATGAATTACCTTATAAGTAAATGCCATTAAGGAAGGA 
TAGCTGGAAGATGGGTTGAGGGGAATGGAGGACCACAGAACTAGTCCTATTTAAATACAT 
GTGCATGGTAAAATGATTCCATTTGACAATAGGTTAATTATCTCATAGCATAAGGAAAAT 
GCTTAACAGTCATATGCAAGATGATAAGCTTTCCTATAGCATCCAACCAAAAGATCTAGC 
CAGTACAATTTCCTTTGCTATATTAGGGTTAGAAAGGCCCCCAGAGGTGAACCAATTAGA 
TGGAATCCTTGAATAAAACACTGGATTAGCAGTGAACAGAAAAAAGTCAGATTGCTTTCC 
TTCTTCCCATAGATGTCTCAGGGATATTTAGTTTCCTCAGAAGATAAAGAATTTAGTAAG 

CTGCATGATAACAAAAATTGTGTTATGCTTGCTTTAGCTGGTATTTTTGCCTAGAACGAT 
TATATCGTTCGGACAAGAAGCTATTCCTAAGAAACAATATTTTTAATCCAGGAAGTTTTT 
CATTTTTAGAAATTTATCTTACTATTTCCCAAGCAAAAGAGGGTAGTTACAGATTCACTA 
AGAATCATGTGCTCACAATTTTTATTTAATAATTATTCCTCCTTAAAATATATTAATCAC 
CTGACTTACAATGGTGGAACCATGAGTGCATTTTTGCCTTTATTGTCAATAACGTCTTCT 
CAGAAGTGAGCCACAAAGGTGCATAGTTCTTGGAGTTAAAGGTCTGAATTAAGACAATCC 
AGCATAAGTCTCATTAATGTGTGATTATTTTGAGAAAAGGCAAGAAGTACCTAAGAATCT 
CCCCCTCACTGTCCAGTTCCCTGTTTCATTTAAAGATTCACTGTAAGTAACTGAAAGGCT 
TTCCTTGGGAGGATTTATTTGAATCAGTCTTTCACATGCAAAGGATATTGTAGAACATCT 
CGTTTTTGCTGGCAGGAATATGAACATCTGTTGTGAGGAAAGAAAAAGTTTCATGCAAAT 
TACACTGCCAAAGAAGGGATGTTCAAGTTGAGAAACCAGTGACATTTCTTGTAACTGTAC 
TATGAATCAGCGCATTTTAATCTTCTAGATAATATATGGAAGTGCAGGAAGGTGGTAGGA 
AACGGTGTTCATTTTACATATGCGTTATTTTATTCTGTGTGAGTGACTTCATGGCACCGA 
CATTGCTGTTTTTAAATGAGGATACAGTAAATTGCAGTCCGAGGAAGGCTAACTGGAATC 
AACATACCCGTAGCTTTAGAAAGCAGTTTCCGCACCAGCGAAGAGTACAAGAGCGATGGA 
ACCCCATGTTCCTGGAAGTTTGCACATCAGAGTAAACAAACTTGAAAACCCCTCTTGATA 
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GCAGAATTCACCCAGCCTTGTTCCATTTTCTCTTAACAAAACACACCGCAAAAGCTCTCA 
CAAGCTGCTTTGATGAAGCCACATGTATTTCCCCCTTCACAATTTACAGGAAGTTACTCT 
TAAAAGAAAGTGATTCTGGTGTTTACCGCCTGTGTTAAAGGGACAGAGTTCCTTTTTATT 
TCTGATAACGTTTGAGCGAAATACAGAAACTATCTGTAGACTAGCATAGTCGGTACGTGA 
GTAAGGAAAAGCAATAACCTGCTGTCCGGTGAGCACAAAATTCCTGCTACGAACAGTGCC 
TTACTGCTGCTTGGAGACTGCAAGTCGCAGATCACACTAGGTATTGACTGATTGTATAAG 
GAAATTTCTTAAAGTCTAAAGTAAAGGTGGTACCTCCTAAAAAGAGGGGAAGAGAGAAAA 
CTTTGTGTGGAAGGATAAGGAGTGTGTTTATAGTTTCAGTAAGAGTGTACGTTTTAATTT 
TTCTTCTTCCTCTGCCTCTTTGCCAAGTAGCCTGAGTGCATCTGTTATCCAGAAGTAGTA 
TTACTCTAGGACAAACTTCAAATTCTTCATTCTGCGTTGCCTTTAAGGAACAACATACTT 
TCTTCCTGTTCTTTTTCCAAAAACACACGCCTATGGCTCTGTGTGTGGTGTTTTAGCCAG 
CCTCCTCCCAGATAAGGGGTTCCCTTCCCTCCTTTGCATTGAAAGGAAAGTGCAAGTCTG 
GACATGTTTATCAAGAGGAAAAGTGACTTCTCAGTAATAGACTGTCAAATTCGGGCTGCT 
GCCCGAGTGTTCGCTTTGTTATGGCAGGTGAAGTTCACCTTTGCCCCACCCAGTGTTTCC 
ACAAAAAGGCAAGGTTCCAAGTATTCATATGAACAAGTGTTACTTTAGGACTTGGAGGGT 
TGGGGGTGGAGGATGTTTGCATAGTTGAAGCCTTGGGCGGGGGTGTAGGAAACGGCGAGT 
ACAGAGGCCATAGAAAAAGCTAAGACTCAGTTTGACGTCGTCAGCCGGCTTGGTCTTCTA 
CCCAGTGACTCAAAGCACTAAAAGTCAGCATAATCGGAACTGAAGTCAGTAGCATCGCCC 
ATTTGCCATTCACTGCAGTAGCAAAAGTAGTACTCTGTGGTGGGTTAATCGGTTTGAGGC 
AGCTCCTTAAATGAACATTTGTGTTTCATTTTTCTGTTATTTTCCCGAACATGAAAAGAC 
GATAAAACTGAAATGGAAAAGGTAACTGACAAAAGTGTGCCTTACCTGTTTCCGCCCTGA 
TTTCTGCTGATTCAAGACTATTCTGGCTAAACTGATTGGATTCTTTTTCTAACTAGGCAG 
TAGGGGATCAGAAATCACACACGGTACCGGCTGTGTTTATTCTGAGAGGTGCTGGGGAGC 
TTTGGGTCTGACTTCCTTTTACATGCCTGTCTTCTCTTTTGGACAG ATCTATTCCAGAGG 
GGAGCTTCACCACTTCATTGACGGCTTTAATGAAGAGAAAAGCAACTGGATGCGCTATGT 
GAATCCAGCACAGTCTCCCCGGGAGCAAAACCTGGCTGCGTGTCAGAACGGGATGAACAT 
CTACTTCTACACCATTAAGCCCATCCCTGCCAACCAGGAACTTCTTGTGTGGTATTGTCG 
GGACTTTGCAGAAAGGCTTCACTACCCTTATCCCGGAGAGCTGACAATGATGAATCTCA G 
TAAGTGGATTACAGAACAAAAAAATAAAAAATGCCAGTAATGTCGGTTCTGCCCCTTTGA 
ACTAATAACATGTTGTTTAATTATACGGCTTTGTCATGTGTTGGATGAAGTAGGTGGCTT 
AAGCTAGGGACTAGGAAGAGGAAAAACATTTTTTGAGTCCCTATTAACTATTAGGAAACT 
TGATCATTTAAAAGTATATATATATATGAGGAGCTACCTTGAGTTTTGAATTCAGGATGT 
TACAGGAAGAAATATATGTCCAATTCTAATTTATCCAAAAGCAGTTGGGAGAATTACAGG 
GATTGGTCCAGACATGCTGCGTATGCAAGGTATAGCCCTCATCTGTGGTACTTTGGCAGG 
GCTTAGACTGCATCAAAATATTTATAGATGTACATTTGAGTGTACAGTTAGGATCTGATG 
TGGAACATTGTAAGATCATTGCTAGAAAAACTTTGTCATAATTTTTCAATATTATTCTAA 
GTGAATAACCGTAAAGATTTTACATCTTAGCTTCCTTCCTTACAGTAAAAAAACTATCTG 
ATCTCTTGATCAGTATTATAGTAGCCACCTATCACTTTATCTTAACAAATTCTCAATTCC 
TTAGGTTTATGTGCTTTTACTTCTTTTATTTGATTAAAATTGCTGTCATGACCTCTCTCT 
GCAGAGGGCTGCATCATTTTGGTCATTCTCAAGTGATCTCTTTGAGCAA.TTTAAGAATTG 
CCATAAGATTCTAACCTCTGCTGTAACTATGGTTGTGTGTTCTTGGTTAGACCACTAAAT 
CTTATTAGCAGTTTTAAAAATTATTCCTTTTGGTTTAGAAGTTAAGACTAAATGCTGAAG 
TTTTTGTAACTTTTGGTTTTGATATCATTTCAAACTTAAGAAAACATTTGAAGAAAAGGA 
CAAAGAATTTC C ACTTAC CCTTTAC C CAGGTTTAC CAGTTATTGATAAGTATAT C C ATTT 
GCTTTACCAGAAGGCTAACTTGTTTTAGTTCTCATTTTCACCTTTGAGACATTTGGAATA 
AATATCAATGTTAACATAAATTGGAATTTTGACTTTGATTTTAGGACCAATGAACAAGCC 
AAGTACTTACCCTAGTCATATATAATCCAACTGTATGGTTATTTGGTATTCATTCCACAC 
TTCATTTTACTTGATCTCCCTTAAGATTGC7UVGATTGTGTTTGCAGTTTTTCTGAAAATC 
TGGGGCTATAAAAGCATCAGGACCTCCCCCGTAGGGGAGGTCGTGTGTTTGGGGTCCTTA 
CACAACAGGTTACCCTTGAGCTTCAGGAAAAGAACTGGCTCTCAGTTCCCCAGTTCCAGC 
TTAATGGGTCTAATTAGGTCCTGACCAAAAAGGTGGCAGTTCTTTTCCCTCATGTCTCTT 
CAGCGCTCCCCGAGACTCTGGAGACTCTGTCATATCCCTAGGGCTGAGCCTCCCAGGAAC 
CATTCGGCTGTTGTGGCATCTGTGTATGCCATGCCCAGTGCTGAGGACCTAGTAACAAAC 
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GACAAATGCACAGGCACAGTGGCATTTTTGTGGAACTCGTATTCCAGCTGTGCGTCTCAG 
AAGAAGCGCACAGCTCCCTCCTGGCTTTCTTAACATAGTGAGCCACTTCCACTTAAGGGT 

ScS?acStccttgagtttaatca T tcatggattcagaggaaagtcttttgatttttg 

Stttctttaaacagttcatttgaggtgacctaccccagtgactttgcaccaaccaccaa 

gaaacttttttgcatgcttcccgcaccctgtgccaatcaagggaagggtttaaaggcctg 

^tttattcctcaaagaaaggttttgcacagtattttaaggttcaagtgcttctact 

?S™agaagcaactgtcatatatactgtgaaatgacaccttttatttatc 

SStatgcagtatgtccccttttattttggcagaattttttctaaatggtggtttaac^ 

ttttcaagcacatttcattgtccaatattcatagtaaagaatgagagttaacaataacca 

ScacStaaaacaagattcctgctgccagttgtgaaaccggttgtcttaggcgtggcag 

Sgatgat^aSgtgatcaggaaaatttccactatttcatcaggcctaa^^^ 

IgStctcca^gggcttaaatggcagtgatggttcaggcggtagagtttggagaagaa 
?SSaaaaa5aaaggaaaaggaataaaagaactaat^ 

caaa^^agggggggaggtattttttttctatctatctaactaacccatctagaaaa 

C^GTTGACCAAATTATAGACTTCTAAATGTTAATCTGCTTTCTCAGTTTCAGTTGAAAAG 

SatSScgaaaatgtgagtcggcataattaagccattcggagtcttcagaagca^ 

actStgaaatgactccgtccgcctacagccatttaagatttcagaacaaa^ 

tcIttttctttttcatgttaactcaagctgttgctgagtgggagagtcagaaatgacacc 

SSccaSgat^^ 

JgScScSaaStccacctgtagagcatcttagggaggctaacatgt 
SctStagaataagatgcaaatctatttttctgaaggcattagagatagcaaacattt^ 

ssgag^t™^^ 

SggStttttgttggcc^^ 

agotaStaIgaagaatccctggctaaatgtgaggggcagtgccacagatggactgaaac 

™gS^cacatttatgctattattatttgttgaattatag^ 
Jggaagcc^ctggaaaaaatatgagacttagatacataatttgagtaaaaatggctcaaa 

gtcmgaSgtaaagttttttgtatttccattttattcgagcggcatcgtttttaa^ 
SSSgStttgaccctatatagatgtttccaaataattctttttcaccttcataaaa^ 

TCCTTCCTGTGGCTGTGAGATGCCTTGCCTAT^ 

JcSttaccattttagctttaaaaaacaaaagtgacaattagaacttcctgcctgctggg 

CCTCACTGA^.GACCGATATTGGCCTGATAAGGAGATATTTATTTTGTTTTAGTGGCTTC 

agaaatccc^tccScagcaagctttccatcacggccc 
Sg^SStSctgtgtttattctggggcttcaggctcgcccaggagg 

S?ggcagg^^ 

g^SSgaSaatacatttaaagggttcagttctggagtttcacagagttcatttcta 

gIS?atcaga?aScaagtgtggagttctttctcaactaaattcaag 
SgacgISaaggatatttgcacaaaggcttcagcatgatcccccaaacctgct^ 

raAGGCATCTCCACACATTGACAGCCAATGCCTTCAGTGCGTTCCTAGGGCAGGTGTCCT 

TGGTTTCCAGGCAAGGCTGAGCAGGGAATTTTCAGTTTTCCCTGCCCAGATGGGTGTTTT 
TTCCTGAAGGCATCATTTATTGTGTAGCGAGGAGACAGGGCTGGCTGTGGCAGGGATAGT 
CTA^GAACTCTCCTCATTGCTGCTGTTCCTAAATAGTATCTTTACCAAGTAATAACGTGCC 

ctc^Saataagtgc^ 

??gaac?ggScaggaagtacctattg T ggtttggcagaggtgactgtcacgccttgto 
ScgagSccagcactgctgggatcctggctagaccagacagagccttggtgaagtgct 

SgS?g?ctgcacatcgcgaggaaggtggtattcacttcgctaagctcc^ 

SSSgaacagggctttatcaaattcgtattcaacaagagtagaagcgaaaattgatga 

ctgtgtattacttgaaatgagtcttaatctttcacatttagttctcagggtatgctgatt 
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CCCAGTATTTTTCCACTCCATTAAAATGGAAGTTTTTTTTTTTTTTTTCTTTTTTGAGAC 
AGAGTTTTGCTCTTGTTGCCCAGTCTGGAGTGCAATGGCACAATCTCGGCTCACCACAAC 
CTCCACCTCCCAGATTCAAGCGATTCTTCTGCCTCAGCCTCCCAAGTAGCTGGGATTACA 
GGTGTGCGCCACCACGCCCAGCTAATTTTGTATTTTTAGTAGAGATGGGGTTTCTCCATG 
TTGGTCAGGCTGGTCTCGAACTTCCGACCTCAGGTGATCCGCCCACCTCGGCCTCCCAAA 
GTGCTGGGATTACAGGCAAGAGCCACTGCATCCAGCTTAGGCTATCTTACTCCAGCCTAA 
ACAGCAATTTTCTATCATAAGGTCTGTACTAATGAAAACAGAATCACCCAAGGCTGCTGT 
TTGTTCTGTCTGTGCTGCCATTGTCCGCATTTTGCTGAGGAGGAAACGGAACTGCACTTT 
TGAGTGAGTGGCCCAGAGCCTTCTAGAATGAGAGTGCGTTGGAAGCCAGATATGTGGCGA 
TTGTGTCGCCAGCTGTTACTCAGGTTTTCTCAAGAAGGAGGAGCAACTTTGGCAGTTTTG 
CTTCAGTTCTCTCTAGCCCTCTGTGTAATCGCCCCTTTTTCTTTATTTCAGCACAAACAC 
AGAGCAGTCTAAAGCAACCGAGCACTGAGAAAAATGAACTCTGCCCAAAGAATGTCCCAA 
AGAGAGAGTACAGCGTGAAAGAAATC CTAAAATTGGACTCCAACCC CTCCAAAGGAAAGG 
ACCTCTACCGTTCTAACATTTCACCCCTCACATCAGAAAAGGACCTCGATGACTTTAGAA 
GACGTGGGAGCCCCGAAATGCCCTTCTACCCTCGGGTCGTTTACCCCATCCGGGCCCCTC 
TGCCAGAAGACTTTTTGAAAGCTTCCCTGGCCTACGGGATCGAGAGACCCACGTACATCA 
CTCGCTCCCCCATTCCATCCTCCACCACTCCAAGCCCCTCTGCAAGAAGCAGCCCCGACC 
AAAGCCTCAAGAGCTCCAGCCCTCACAGCAGCCCTGGGAATACGGTGTCCCCTGTGGGCC 
CCGGCTCTCAAGAGCACCGGGACTCCTACGCTTACTTGAACGCGTCCTACGGCACGGAAG 
GTTTGGGCTCCTACCCTGGCTACGCACCCCTGCCCCACCTCCCGCCAGCTTTCATCCCCT 
CGTACAACGCTCACTACCCCAAGTTCCTCTTGCCCCCCTACGGCATGAATTGTAATGGCC 
TGAGCGCTGTGAGCAGCATGAATGGCATCAACAACTTTGGCCTCTTCCCGAGGCTGTGCC 
CTGTCTACAGCAATCTCCTCGGTGGGGGCAGCCTGCCCCACCCCATGCTCAACCCCACTT 
CTCTCCCGAGCTCGCTGCCCTCAGATGGAGCCCGGAGGTTGCTCCAGCCGGAGCATCCCA 
GGGAGGTGCTTGTCCCGGCGCCCCACAGTGCCTTCTCCTTTACCGGGGCCGCCGCCAGCA 
TGAAGGACAAGGCCTGTAGCCCCACAAGCGGGTCTCCCACGGCGGGAACAGCCGCCACGG 
CAGAACATGTGGTGCAGCCCAAAGCTACCTCAGCAGCGATGGCAGCCCCCAGCAGCGACG 
AAGCCATGAATCTCATTAAAAACAAAAGAAACATGACCGGCTACAAGACCCTTCCCTACC 
CGCTGAAGAAGCAGAACGGCAAGATCAAGTACGAATGCAACGTTTGCGCCAAGACTTTCG 
GCCAGCTCTCCAATCTGAAG GTAGGCCTTGAGAGAGAGCAGTCCAAGGGGCTGTGAGTGC 
ATGCTTGTGTTTGTATTTAGCTTGCTTTCCATGGGGTATCGATTGCATTTGCAGTAGTAT 
GAGCCCCCGGTTGGGGATAGTGGGTATGGATTCCGCCTGGCTTTTGCCACTTCTAGCTCT 
TTGACTTTGGACAAGTGACTTCCCTTCTCCTGATTTTCTTCTGAATAATAAAAAAATTAG 
GGGTTTGGACTAGAAGATTAGGTGAAACTCCCTGCTAGCCTGTGATTTTTGTGCTTTTAA 
GAAAAACACCATTCTGAAAACATGAAGATTTCTTCTTTTTAAGACTGTCTTGATGCTTTT 
CTTAAGATATTTGCATCT^ACACTTGAGTCTTGGAGCAGAAATGTTAGGTCTCAGAGCCAG 
CTTGAGAGCAGAGCTAACACATGTGGCTTCTTCCCAG GTCCACCTGAGAGTGCACAGTGG 
AGAACGGCCTTTCAAATGTCAGACTTGCAACAAGGGCTTTACTCAGCTCGCCCACCTGCA 
GAAACACTACCTGGTACACACGGGAGAAAAGCCACATGAATGCCAG GTGCGCAGTATTTT 
CTGGGTAGACCTTCTGACCTTTGTAGAAAATGTCTGTGAGTCACCCTCCCATGTCCTATA 
TAGCCCGTAGTTAAAGCCAACACCAGATTCTGCGTTGTCCCATCCTGGACTGATGGCACT 
ATGGTCCTTCCCAGTACTTTGTATCTGCTGATGACTTGAGATGGCACAGCCAGCTTCCAG 
TGGGTGGGAAAATGGTAGGGGAAATAAACAGCCCCTCGTGTGCTGTGTGCCCACATCCCC 
CCGTTTGCTTAATACCACACTGGAGGTGCCACAAGGAGGCTTCTCACCTCCTAGGTTGCT 
GGGCGTTGGCCGGTAAGCCTGCCCCTCCCGTTGGCAACTCTTAATCTTCTGGCCTTCCTG 
TCTCCCTTCCCTGCTGTCTCTCTCCCCTACACTGTAG GTCTGCCACAAGAGATTTAGCAG 
CACCAGCAATCTCAAGACCCACCTGCGACTCCATTCTGGAGAGAAACCATACCAATGCAA 
GGTGTGCCCTGCCAAGTTCACCCAGTTTGTGCACCTGAAACTGCACAAGCGTCTGCACAC 
CCGGGAGCGGCCCCACAAGTGCTCCCAGTGCCACAAGAACTACATCCATCTCTGTAGCCT 
CAAGGTTCACCTGAAAGGGAACTGCGCTGCGGCCCCGGCGCCTGGGCTGCCCTTGGAAGA 
TCTGACCCGAATCAATGAAGAAATCGAGAAGTTTGACATCAGTGACAATGCTGACCGGCT 
CGAGGACGTGGAGGATGACATCAGTGTGATCTCTGTAGTGGAGAAGGAAATTCTGGCCGT 
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GGTCAGAAAAGAGAAAGAAGAAACTGGCCTGAAAGTGTCTTTGCAAAGAAACATGGGGAA 
TGGACTCCTCTCCTCAGGGTGCAGCCTTTATGAGTCATCAGATCTACCCCTCATGAAGTT 
GCCTCCCAGCAACCCACTACCTCTGGTACCTGTAAAGGTCAAACAAGAAACAGTTGAACC 
AATGGATCCTTAAGATTTTCAGAAAACACTTATTTT GTTTCTTAAGTTATGACTTGGTGA 
GTCAGGGTGCCTGTAGGAAGTGGCTTGTACATAATCCCAGCTCTGCAAAGCTCTCTCGAC 
AGCAAATGGTTTCCCCTCACCTCTGGAATTAAAGAAGGAACTCCAAAGTTACTGAAATCT 
CAGGGCATGAAC AAGG C AAAGGC CATATATATATATATATATATAT CTGTAT AC AT ATTA 
TATATACTTATTTACACCTGTGTCTATATATTTGCCCCTGTGTATTTTGAATATTTGTGT 
GGACATGTTTGCATAGCCTTCCCATTACTAAGACTATTACCTAGTCATAATTATTTTTTC 
AATGATAATC CTTC ATAATTTATTATACAATTTAT C ATT CAG AAAG CAATAATTAAAAAA 
GTTTACAATGACTGGAAAGATTCCTTGTAATTTGAGTATAAATGTATTTTTGTCTTGTGG 
CCATTCTTTGTAGATAATTTCTGCACATCTGTATAAGTACCTAAGATTTAGTTAAACAAA 
TATATGACTTCAGTCAACCTCTCTCTCTAATAATGGTTTGAAAATGAGGTTTGGGTAATT 
GCCAATGTTGGACAGTTGATGTGTTCATTCCTGGGATCCTATCATTTGAACAGCATTGTA 
CATAACTTGGGGGTATGTGTGCAGGATTACCCAAGAATAACTTAAGTAGAAGAAACAAGA 
AAGGGAATCTTGTATATTTTTGTTGATAGTTCATGTTTTTCCCCCAGCCACAATTTTACC 
GGAAGGGTGACAGGAAGGCTTTACCAACCTGTCTCTCCCTCCAAAAGAGCAGAATCCTCC 
CACCGCCCTGCCCTCCCCACCGAGTCCTGTGGCCATTCAGAGCGGCCACATGACTTTTGC 
AT C C ATTGTAT TAT C AG AAAATG T G AAG AAG AAAAAAAT G C CAT G T T T T AAAAC C ACTG C 
GAAAATTTCCCCAAAGCATAGGTGGCTTTGTGTGTGTGCGATTTGGGGGCTTGAGTCTGG 

TGCACAAACATGGTGCTCTACCAGGAAGGATTCGAGGTAGATAGGCTCAGGCCACACTTT 
AAAAACAAACACACAAACAACAAAAAACGGGTATTCTAGTCATCTTGGGGTAAAAGCGGG 
TAATGAACATTCCTATCCCCAACACATCAATTGTATTTTTTCTGTAAAACTCAGATTTTC 
CTCAGTATTTGTGTTTTTACATTTTATGGTTAATTTAATGGAAGATGAAAGGGCATTGCA 
AAGTTGTTCAACAACAGTTACCTCATTGAGTGTGTCCAGTAGTGCAGGAAATGATGTCTT 
ATCTAATGATTTGCTTCTCTAGAGGAGAAACCGAGTAAATGTGCTCCAGCAAGATAGACT 
TTGTGTTATTCTATCTTTTATTCTGCTAAGCCCAAAGATTACATGTTGGTGTTCAAAGTG 
TAGCAAAAAATGATGTATATTTATAAATCTATTTATAC CAC TAT AT C ATATGTATATATA 
TTTATAACCACTTAAATTGTGAGCCAAGCCATGTAAAAGATCTACTTTTTCTAAGGGCAA 
AAAAAAAAAAAAAAAAAAAAGAACACTCCTTTCTGAGACTTTGCTTAATACTTGGTGACC 
TCACAATCACGTCGGTATGATTGGGCACCCTTGCCTACTGTAAGAGACCCTAAAACCTTG 
GTGCAGTGGTGGGGACCACAAAACAACCAGGGAGGAAGAGATACATCATTTTTTAGTATT 
AAGGACCATCTAAGACAGCTCTATTTTTTTTTTGCCACTTTATGATTATGTGGTCACACC 
CAAGTCACAGAAATAAAAAACTGACTTTACCGCTGCAATTTTTCTGTTTTCCTCCTTACT 
AAATACTGATAC ATTACTC CAATCTATTTTATAATTATATTTGAC ATTTTG TT CAC ATCA 
ACTAATGTTCACCTGTAGAAGAGAACAAATTTCGAATAATCCAGGGAAACCCAAGAGCCT 
TACTGGTCTTCTGTAACTTCCAAGACTGACAGCTTTTTATGTATCAGTGTTTGATAAACA 
CAGTCCTTAACTGAAGGTAAACCAAAGCATCACGTTGACATTAGACCAAATACTTTTGAT 
TCCCAACTACTCGTTTGTTCTTTTTCTCCTTTTGTGCTTTCCCATAGTGAGAATTTTTAT 
AAAGACTTCTTGCTTCTCTCACCATCCATCCTTCTCTTTTCTGCCTCTTACATGTGAATG 
TTGAGCCCACAATCAACAGTGGTTTTATTTTTTCCTCTACTCAAAGTTAAAACTGACCAA 
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GTCTGGACTTGTGGTGCGCTGCCAGGGATCCGCAGCGTTGCCGGTTGTATTCGCTGGATACCAGAGGGCG 
GAAGTGCAGCAGGGTTCAGCTCCGACCTCCGCGCCGGTGCTTTTTGCGGCTGCGCGGGCTTCCTGGAGTC 
CTGCTACCGCGTCCCCGCAGGACAGTGTGTCAGGCGGGCAGCTTGCCCCGCCGCCCCACCGGAGCGCGGA 
ATCTGGGCGTCCCCACCAGTGCGGGGAGCCGGAAGGAGGAGCCATAGCTTGGAGTAGGTTTGGCTTTGGT 
TGAAATAAGAATTTAGCCTGTATGTACTGCTTTAACTCCTGGAAGAATGACAGATGACAAAGATGTGCTT 
CGAGATGTGTGGTTTGGACGAATTCCAACTTGTTTCACGCTATATCAGGATGAGATAACTGAAAGGGAAG 
CAGAACCATACTATTTGCTTTTGCCAAGAGTAAGTTATTTGACGTTGGTAACTGACAAAGTGAAAAAGCA 
CTTTCAGAAGGTTATGAGACAAGAAGACATTAGTGAGATATGGTTTGAATATGAAGGCACACCACTGAAA 
TGGCATTATCCAATTGGTTTGCTATTTGATCTTCTTGCATCAAGTTCAGCTCTTCCTTGGAACATCACAG 
TACATTTTAAGAGTTTTCCAGAAAAAGACCTTCTGCACTGTCCATCTAAGGATGCAATTGAAGCTCATTT 
TATGTCATGTATGAAAGAAGCTGATGCTTTAAAACATAAAAGTCAAGTAATCAATGAAATGCAGAAAAAA 
GATCACAAGCAACTCTGGATGGGATTGCAAAATGACAGATTTGACCAGTTTTGGGCCATCAATCGGAAAC 
TCATGGAATATCCTGCAGAAGAAAATGGATTTCGTTATATCCCCTTTAGAATATATCAGACAACGACTGA 
AAGACCTTTCATTCAGAAGCTGTTTCGTCCTGTGGCTGCAGATGGACAGTTGCACACACTAGGAGATCTC 
CTCAAAGAAGTTTGTCCTTCTGCTATTGATCCTGAAGATGGGGAAAAAAAGAATCAAGTGATGATTCATG 
GAATTGAGCCAATGTTGGAAACACCTCTGCAGTGGCTGAGTGAACATCTGAGCTACCCGGATAATTTTCT 
TCATATTAGTATCATCCCACAGCCAACAGATTGAAGGATCAACTATTTGCCTGAACAGAATCATCCTTAA 
ATGGGATTTATCAGAGCATGTCACCCTTTTGCTTCAATCAGGTTTGGTGGAGGCAACCTGACCAGAAACA 
CTTCGCTGCTGCAAGCCAGACAGGAAAAAGATTCCATGTCAGATAAGGCAACTGGGCTGGTCTTACTTTG 
CATCACCTCTGCTTTCCTCCACTGCCATCATTAAACCTCAGCTGTGACATGAAAGACTTACCGGACCACT 
GAAGGTCTTCTGTAAAATATAATGAAGCTGAAACCTTTGGCCTAAGAAGAAAATGGAAGTATGTGCCACT 
CGATTTGTATTTCTGATTAACAAATAAACAGGGGTATTTCCTAAGGTGACCATGGTTGAACTTTAGCTCA 
TGAAAGTGGAAACATTGGTTTAATTTTCAAGAGAATTAAGAAAGTAAAAGAGAAATTCTGTTATCAATAA 
CTTGCAAGTAATTTTTTGTAAAAGATTGAATTACAGTAAACCCATCTTTCCTTAACGAAAATTTCCTATG 
TTTACAGTCTGTCTATTGGTATGCAATCTTGTAACTTTGATAATGAACAGTGAGAGATTTTTAAATAAAG 
CCTCTAAATATGTTTTGTCATTTAATAACATACAGTTTTGTCACTTTTCAAGTACTTTCTGACTCACATA 
CAGTAGATCACTTTTTACTCTGTGTTACCATTTTGACTGGTCGTCATTGGCATGGGGTGGATATAGGGCA 
TAGGATTACTTGTCTCAGAAGCTGTCATAGAATTTCTTGCTGCCAATTAAAAAACCTGTGTTCTTTACAC 
ACTACACGTATAAATATTGTAACTGTTCATCTTTGTTGTTTTATCACTGTAAGCCTGTCAAATCATAGTA 
TCCTAAGCATCTGTAAATGCTAATTTTGCATTTTTGGAAAAACCCATTCCTTCCAAGCTAGTGTTTTTCA 
TTGGCTCCAGGTCTAATTTTTCACTGTGGTCCCTGGCAGCCAGTCTTTTGAAGTTTAAAGATTACCTGTC 
TCTTGACTGCAGTACCTTTTCTTTAATTTTTACCAAAAATATCCAGAGGTTACTGGAGTTCTTATTCAAT 
ATAAGGAAAGTTTGCTGCACTTTATTACCAAGCCTCTGGGATTTTACCAGTCAAACATATTTGTGCATTA 
CATTTCATTTCTTGTGAGCTAGCTGGCTGTCCATATTGAATGTTGACCCATTTGAGTACGCTAAAAGGCT 
TACAGTATCAGACACGATCATGGTTTTAGATCCCATAATAAAAATGRATGTTTTTCTTATAAAAAATTAT 
ACAAATGCTGAAGTGAGATTCTACTATTGTTCATTGCTTCCTTTTCTTTTTCCTTTTGCGATTTTCACTG 
ATTAATAGCACATTTCTTCACAAAATTAGATAAAGTTGGTCAAAGACCAGATATTCTGGAATGGAAATTG 
TAAAGCTTAATCAAAAAGAATAGCCAGTACAGCATACAATCTCAGAAACTTAGAAGCAAGTAGAAAATAA 
TTGGTTGATGTAAACGAAAGTGCCATTTTAGTAAAGGCAGGAAAAAAATAGCAATATTTGAGTTATGTAA 
GGATAAAAAATCCACTGACTTGTATTTTTGCACAAGAGGCTGGTCTGAATATGATTGTTCACATTAAGAG 
TGTTTATTCGTCGGTTCATTTTGGGGATTTTCCCCCTTGATGTTTTGACAGATTGAAGTGAGCTTTAGTG 
AGCAAAAGGATCAGAATGCAGGGAACACTAAGCTGTGATGAAGAAAGTGTGGTAAAAAGCCAGAGTAGTT 
TTATACAGACAAAACCAGTGTCAGGCCTTTGCAGTAGGCTTGAGTGAACTTCTGATCTAGATTTGAAAGT 
AAATTTTATGAAGACATTGC C CATTTTTACTT C CTCATTCATTATTGTAC C AGCAT C ATAGCTTTATTAC 
TCTAATCCCAGGTAAGTCAAGCCTACAATGCCCTAGAGGAAGAGTAAAACCAGAAATTCATGCTGGCTTA 
AATAATCTATTTTTGTTTCTTTTCATTTGAATATTTAAATTTTATGGTTTATTAAAAAATTAAATAAAAA 
AGAAAAAAAAAAAAAAAAAAAA 
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GAA.TTCCGGGAAGCCAGACGGTTAACACAGACAAAGTGCTGCCGTGACACTCGGCCCTCCAGTGTTGCGG 
AGAGGCAAGAGCAGCGACCGCGCACCTGTCCGCCCGGAGCTGGGACGCGCGCCCGGGCGGCCGGACGAAG 
CGAGGAGGGACCGCCGAGGCTGCCCCCAAGTGTAACTCCAGCACTGTGAGGTTTCAGGGATTGGCAGAGG 
GGACCAAGGGGAC ATGAAAATGGACATGGAGGATGCGGATATGACTCTGTGGACAGAGGCTGAGTTTGAA 
GAGAAGTGTACATACATTGTGAACGACCACCCCTGGGATTCTGGTGCTGATGGCGGTACTTCGGTTCAGG 
CGGAGGCATCCTTACCAAGGAATCTGCTTTTCAAGTATGCCACCAACAGTGAAGAGGTTATTGGAGTGAT 
GAGTAAAGAATACATACCAAAGGGCACACGTTTTGGACCCCTAATAGGTGAAATCTACACCAATGACACA 
GTTCCTAAGAACGCCAACAGGAAATATTTTTGGAGGATCTATTCCAGAGGGGAGCTTCACCACTTCATTG 
ACGGCTTTAATGAAGAGAAAAGCAACTGGATGCGCTATGTGAATCCAGCACACTCTCCCCGGGAGCAAAA 
CCTGGCTGCGTGTCAGAACGGGATGAACATCTACTTCTACACCATTAAGCCCATCCCTGCCAACCAGGAA 
CTTCTTGTGTGGTATTGTCGGGACTTTGCAGAAAGGCTTCACTACCCTTATCCCGGAGAGCTGACAATGA 
TGAATCT CACACAAACACAGAGCAGTCTAAAGCAAC CGAG C AC TGAGAAAAATGAACTCTG C C C AAAGAA 
TGTCCCAAAGAGAGAGTACAGCGTGAAAGAAATCCTAAAATTGGACTCCAACCCCTCCAAAGGAAAGGAC 
CTCTACCGTTCTAACATTTCACCCCTCACATCAGAAAAGGACCTCGATGACTTTAGAAGACGTGGGAGCC 
CCGAAATGCCCTTCTACCCTCGGGTCGTTTACCCCATCCGGGCCCCTCTGCCAGAAGACTTTTTGAAAGC 
TTCCCTGGCCTACGGGATCGAGAGACCCACGTACATCACTCGCTCCCCCATTCCATCCTCCACCACTCCA 
AGCCCCTCTGCAAGAAGCAGCCCCGACCAAAGCCTCAAGAGCTCCAGCCCTCACAGCAGCCCTGGGAATA 
CGGTGTCCCCTGTGGGCCCCGGCTCTCAAGAGCACCGGGACTCCTACGCTTACTTGAACGCGTCCTACGG 
CACGGAAGGTTTGGGCTCCTACCCTGGCTACGCACCCCTGCCCCACCTCCCGCCAGCTTTCATCCCCTCG 
TACAACGCTCACTACCCCAAGTTCCTCTTGCCCCCCTACGGCATGAATTGTAATGGCCTGAGCGCTGTGA 
GCAGCATGAATGGCATCAACAACTTTGGCCTCTTCCCGAGGCTGTGCCCTGTCTACAGCAATCTCCTCGG 
TGGGGGCAGCCTGCCCCACCCCATGCTCAACCCCACTTCTCTCCCGAGCTCGCTGCCCTCAGATGGAGCC 
CGGAGGTTGCTCCAGCCGGAGCATCCCAGGGAGGTGCTTGTCCCGGCGCCCCACAGTGCCTTCTCCTTTA 
CCGGGGCCGCCGCCAGCATGAAGGACAAGGCCTGTAGCCCCACAAGCGGGTCTCCCACGGCGGGAACAGC 
CGCCACGGCAGAACATGTGGTGCAGCCCAAAGCTACCTCAGCAGCGATGGCAGCCCCCAGCAGCGACGAA 
GCCATGAATCTCATTAAAAACAAAAGAAACATGACCGGCTACAAGACCCTTCCCTACCCGCTGAAGAAGC 
AGAACGGCAAGATCAAGTACGAATGCAACGTTTGCGCCAAGACTTTCGGCCAGCTCTCCAATCTGAAGGT 
CCACCTGAGAGTGCACAGTGGAGAACGGCCTTTCAAATGTCAGACTTGCAACAAGGGCTTTACTCAGCTC 
GCCCACCTGCAGAAACACTACCTGGTACACACGGGAGAAAAGCCACATGAATGCCAGGTCTGCCACAAGA 
GATTTAGCAGCACCAGCAATCTCAAGACCCACCTGCGACTCCATTCTGGAGAGAAACCATACCAATGCAA 
GGTGTGCCCTGCCAAGTTCACCCAGTTTGTGCACCTGAAACTGCACAAGCGTCTGCACACCCGGGAGCGG 
CCCCACAAGTGCTCCCAGTGCCACAAGAACTACATCCATCTCTGTAGCCTCAAGGTTCACCTGAAAGGGA 
ACTGCGCTGCGGCCCCGGCGCCTGGGCTGCCCTTGGAAGATCTGACCCGAATCAATGAAGAAATCGAGAA 
GTTTGACATCAGTGACAATGCTGACCGGCTCGAGGACGTGGAGGATGACATCAGTGTGATCTCTGTAGTG 
GAGAAGGAAATTCTGGCCGTGGTCAGAAAAGAGAAAGAAGAAACTGGCCTGAAAGTGTCTTTGCAAAGAA 
ACATGGGGAATGGACTCCTCTCCTCAGGGTGCAGCCTTTATGAGTCATCAGATCTACCCCTCATGAAGTT 
GCCTCCCAGCAACCCACTACCTCTGGTACCTGTAAAGGTCAAACAAGAAACAGTTGAACCAATGGATCCT 
TAAGATTTTCAGAAAACACTTATTT 
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CGCCGCCTGTGCAGCCGCTGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCTGCC 
GCCCCGGCTGCCGCGCCGCGCCGCTGCCTCTGCCCCGGCCGCCCCCGCCGCCGCTGCCGCCGCCGGCCCG 
CAGCCAGCCAGGCGGGCGGCCCAGCCCGCCTGAGCCCGCAGCGGCTGCCGCCGCAGCGTCGGGTCGCTGG 
GTGCGCGGGCTACCGCGGACCGAGCGGACCCGAGTGGGCGACCAGGCGCTTGCCCGCCCAGTGCCACTGC 
CGCCGCTTCCTCGCCGGAGCACAGGACCAGACACCTCCAGCGCCCGCTGCTGCTGCCGATGCGGCCCGGA 
CACTTTTAGCTGGGCGGGAGGGCTGGAGAGCCGGGGGCCGCCGAGAACCGCCAGCGAGCTGTGCCGAGAG 
CCGCGCCGACCCGCTGCGATCAGGGACAGGCGCCCGCCCGCCGCCGCCGCCTGGCCGCT ATGGATCTATT 
CGACTTTTTCAGAGACTGGGACTTGGAGCAGCAGTGTCACTATGAACAAGACCGTAGTGCACTTAAAAAA 
AGGGAATGGGAGCGGAGGAATCAAGAAGTCCAGCAAGAAGACGATCTCTTTTCTTCAGGCTTTGATCTTT 
TTGGGGAGCCATACAAGGTAGCTGAATATACAAACAAAGGTGATGCACTTGCCAACCGAGTCCAGAACAC 
GCTTGGAAACTATGATGAAATGAAGAATTTGCTAACTAACCATTCTAATCAGAATCACCTAGTGGGAATT 
CCAAAGAATTCTGTGCCCCAGAATCCCAACAACAAAAATGAACCAAGCTTTTTTCCAGAACAAAAGAACA 
GAATAATTCCACCTCACCAGGATAATACCCATCCTTCAGCACCAATGCCTCCACCTTCTGTTGTGATACT 
GAATTCAACTCTAATACACAGCAACAGAAAATCAAAACCTGAGTGGTCACGTGATAGTCATAACCCTAGC 
ACTGTACTGGCAAGCCAGGCCAGTGGTCAGCCAAACAAGATGCAGACTTTGACACAGGACCAGTCTCAAG 
CCAAACTGGAAGACTTCTTTGTCTACCCAGCTGAACAGCCCCAGATTGGAGAAGTTGAAGAGTCAAACCC 
ATCTGCAAAGGAAGACAGTAACCCTAATTCTAGTGGAGAAGATGCTTTCAAAGAAATCTTTCAATCCAAT 
TCACCGGAAGAATCTGAATTCGCCGTGCAAGCGCCTGGGTCTCCCCTAGTGGCTTCCTCTTTATTAGCTC 
CTAGCAGTGGCCTTTCAGTTCAAAACTTCCCACCAGGGCTTTACTGCAAAACAAGCATGGGGCAGCAAAA 
GCCAACTGCATACGTCAGACCCATGGATGGCCAGGACCAGGCACCGGACATCTCACCAACACTGAAACCT 
TCAATTGAATTTGAGAACAGCTTTGGGAATCTGTCATTTGGAACACTCTTGGATGGAAAACCCAGTGCAG 
CCAGTTCAAAGACTAAACTGCCAAAGTTCACCATCCTCCAAACAAGTGAAGTAAGCCTTCCCAGTGATCC 
AAGCTGTGTTGAAGAAATCTTGCGGGAGATGACCCATTCCTGGCCTACTCCTCTCACTTCCATGCATACT 
GCTGGACACTCTGAGCAGAGCACCTTTTCCATCCCAGGACAGGAATCGCAGCATCTGACCCCAGGATTCA 
CCTTACAAAAGTGGAATGACC CAAC CACCAGAGCTT CTACAAAGTC AGTGT CTTTC AAAT CGATG CTTGA 
GGATGACCTGAAGCTGAGCAGTGATGAAGATGACCTTGAGCCTGTGAAGACCTTGACCACTCAGTGCACT 
GCCACTGAGCTCTACCAGGCTGTTGAAAAGGCAAAACCTAGGAATAATCCTGTGAACCCACCCTTGGCCA 
CTCCCCAGCCCCCACCTGCAGTGCAAGCCAGCGGGGGTTCTGGCAGCTCCAGCGAATCGGAGAGCAGCTC 
TGAGTCGGATTCAGACACTGAAAGTAGCACCACTGACAGCGAATCTAATGAGGCACCTCGTGTGGCAACT 
CCAGAGCCTGAGCCACCCTCAACCAACAAGTGGCAACTGGATAAATGGCTTAACAAAGTGACATCCCAGA 
ACAAGTCTTTTATTTGTGGCCCAAATGAAACACCCATGGAGACTATTTCTCTGCCTCCTCCAATCATCCA 
AC CAATGGAAGTC C AGATGAAAGTGAAG ACGAATGC CAGTCAGGTC C CAG CTGAAC CCAAAGAAAGG C CT 
CTCCTCAGTCTCATTAGGGAGAAAGCCCGTCCACGGCCCACTCAGAAAATTCCAGAAACAAAGGCTTTGA 
AGCATAAGTTGTCAACAACTAGTGAGACAGTGTCTCAAAGGACAATTGGGAAAAAACAGCCCAAAAAAGT 
TGAGAAGAACAC CAGCACTGACGAGTTTACCTGGC C CAAAC C AAATATTAC C AGC AGCACTCCCAAAGAA 
AAAGAAAGTGTGGAGCTTCATGACCCACC AAGAGGC CGCAACAAAGCCACTGC C CAC AAAC CAGC CCCTA 
GGAAAGAACCAAGACCTAACATCCCTTTGGCTCCCGAGAAGAAGAAGTACAGAGGGCCTGGCAAGATTGT 
GCCAAAGTCTCGGGAATTCATTGAAACAGATTCATCTACATCTGACTCCAACACAGATCAGGAAGAGACC 
CTGCAAATCAAAGTCCTGCCTCCGTGCATTATTTCTGGAGGTAATACTGCCAAATCCAAGGAAATCTGTG 
GTGCCAGCCTGAC C CTC AGC AC CTTAATGAGTAGCAGTGGC AG CAACAACAACTTAT C CATC AGT AATGA 
AGAGCCAACATTTTCACCTATTCCTGTCATGCAAACTGAAATCCTGTCCCCTCTGCGAGATCATGAGAAC 
CTGAAAAACCTCTGGGTGAAGATTGACCTTGACTTACTCTCTAGAGTACCTGGCCACAGCTCACTCCATG 
CAGCACCTGCCAAGCCAGACCACAAGGAGACTGCCACAAAACCCAAGCGTCAGACAGCTGTCACAGCTGT 
GGAGAAACCAGCCCCTAAGGGCAAACGTAAGCACAAGCCAATAGAAGTTGCAGAGAAGATCCCTGAGAAG 
AAGCAGCGCCTGGAGGAGGCCACAACTATCTGCTTGCTCCCTCCTTGCATCTCACCAGCCCCACCCCACA 
AGCCTCCCAACACTAGAGAAAATAATTCATCCAGGAGAGCAAATAGAAGAAAGGAAGAAAAACTATTTCC 
TCCTCCACTTTCCCCACTGCCAGAGGACCCTCCACGCCGCAGAAATGTCAGTGGCAATAATGGTCCCTTT 
GGTCAAGACAAAAACATCGCCATGACTGGACAAATCACATCTACCAAACCTAAGAGAACTGAAGGCAAAT 
TCTGTGCTACTTTCAAAGGGATATCGGTAAATGAGGGAGACACTCCAAAAAAGGCATCCTCTGCCACCAT 
CACTGTCACCAATACTGCTATTGCCACTGCTACTGTCACTGCTACTGCCATTGTCACCACCACTGTCACA 
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GCTACTGCCACCGCCACGGCCACCACCACAACTACTACCACTACCATTTCCACCATCACCTCTACCATCA 
CTACTGGCCTCATGGATAGCAGTCACCTGGAGATGACGTCCTGGGCGGCTCTGCCCCTTCTATCCAGCAG 
CAGCACTAATGTCCGGAGACCCAAGCTCACTTTTGATGACTCGGTTCACAATGCTGATTATTACATGCAA 
GAAGCTAAGAAGCTGAAGCACAAAGCTGATGCACTGTTCGAGAAATTTGGCAAAGCTGTGAATTATGCTG 
ATGCCGCCCTCTCCTTCACTGAATGTGGCAATGCCATGGAACGCGACCCTCTGGAAGCAAAGTCCCCATA 
CACCATGTACTCTGAGACTGTGGAGCTCCTCAGGTATGCAATGAGGCTGAAGAACTTTGCAAGTCCCTTG 
GCTTCGGATGGGGACAAAAAGCTAGCAGTACTATGCTACCGATGTTTATCACTCCTCTATTTGAGAATGT 
TTAAGCTGAAGAAGGACCATGCTATGAAGTACTCCAGATCACTGATGGAATATTTTAAGCAAAATGCTTC 
AAAAGTCGCACAGATACCCTCTCCATGGGTAAGCAATGGAAAGAACACTCCATCCCCAGTGTCTCTCAAC 
AACGTCTCCCCCATCAACGCAATGGGGAACTGTAACAATGGCCCAGTCACCATTCCCCAGCGCATTCACC 
ACATGGCTGCCAGCCACGTCAACATCACTAGCAATGTGTTACGGGGCTATGAACACTGGGATATGGCCGA 
CAAACTGACAAGAGAAAACAAAGAATTCTTTGGTGATCTGGACACGCTGATGGGGCCTCTGACCCAGCAC 
AGCAGCATGACCAATCTTGTCCGCTACGTTCGCCAAGGACTGTGTTGGCTGCGCATCGATGCCCACTTGT 
TGTAGTGGGTGTTCTCAGATCTCTAGCATCACGACCCATCACTCTACCTCTACCAGCGCACTGATGGTCA 
CTGGTGGAACTCCACTCACTGGGGAACGTTCTCTTTGGTTATGTTTGTTTTTATGCTTCTTTTGTTATCT 
GTAAAAAACAGAAGTCATTGTAAGTTGACACTACAACTTAAGGGCAGTGTACGTTTTATTACTTAGTCAT 
TTTTTTTCTTTTAGCATTTGATATGCATTTCTCAGATTCCACCATCTTTTTGTGCTTTATGGAATGACAG 
TCCCTACAATATTGTTTTAAGCCCACACTACCCAAAACAAAGAATGGGAAGCACTTGTGATAAAGACAGG 
CTCCTGAGAAATGCAACAAGTGGTCTTACATATACATGAGAACTTAGACACAAGGGACCATCCCCCAAAC 
TCTACTCTTATACCCAGAAAAGAACATATTTCAGAATCTGTCAAACTTTTGTGTATCCCACAGATTCAAT 
CTTCAGGTGAGAATTTTCATTGTCAAAACCCACTGGTTAGATGTTGTAGCAACATCATAAAATCAAGAGT 
ATCAAGAAAATAAATGAGCATAGCAATGCTACTCTTAAAAAGATGCTATGCCACACAACCAGAGGACTTT 
CTTGTTAGCATCCCTTTCCTGATTCCCTATTTTGTTAATTTTAATGATAAGAAGAAAGGGTGACATTTAT 
TTTGACAAGTTTTAGGCATCAGCTGGCATCAGTGTTTTTCAACTCCATTATTTGAAGTGTAAATCCTCAC 
CTGGGGTTCTCTGTGTGCAAAGCTGTCCTTTTGAAGAACAGTTTGGTTGATGCATGCCTTAGTAGCCAAA 
ATGCTACACTCTAGACTTACAAGTGGGAGTTAAGAGAGGTCTGGAAAGTGT C CAACAAGGAATTCACAC C 
TCTGCCTCCTTTGCAACAACAACATTTACACAGTTGGTAAGTGGGTCCATAACTGGCAGGATTTTTAAAT 
TGTATTTTGCTCAAATCTATGGGAACAAAAGTCAAGGTATCACTACCTAGAAGTAATGATATACAGTTTT 
CTTCCTAGTGGCTTGAAAATCTGGACTTCCTCAATTATTATTCACATTTTCTCTCTTATAGGTTTTCTGT 
TTTCTACTTTCTTTTTTCTCTTATCTGTGTTTCCCTTTCCTTTGTTTGGCTCATTAACTTTTGACTGAAT 
TACAATTACTCCTTTTATTAAAGTCCATATTATTGTGAATCATTTCCATGAAAATTTCTAAGAAAACTCC 
AAACTCTCTAAATAGTAGCTAACTTTTATTTTTTTAAAATGAGTCGTGGGGTAGTGCTTCACCTTGAGAT 
GCTTTGAAAGAGCCCTAAACATTGGGAACCATTCACCTAATTTGGAGACATTTCTCACTGGTTGTGACTA 
CCCCCTTATGATCCTTCACATTCATTTTATGTCCCTAAACATCACAATGTAAATATCATTTTTGATGTTC 
CAGCTCACCAGAAGATTCTTACACTTGGGGTAAACACTATCCATGCATTACTTACTGGTAATTACCTGCT 
GGTATATAATTCCATGTAGCCTTTAATATGCTGGGTTATCAAATTCTGTTCACTGAGTTATGACCAGATA 
AATAATAGATATGCACATGAAAGATGCAAACTTGTGTGATTATTAAAGC CAGC CATGCAGGTC CATGATA 
GAAACAGCAGGTGATGACTCTGCACTCTCATTC 

ACTTGAGCTGTGCTCTGGTCATCTTTGAGTTTAAGGCCTTTTGTTGTATAAGGCTGTGGAAGTTGTACTC 
CAATGGCTGAAGCCATGTTGTTAATATGGCTGATGGGAGCATCCCTGCAGCTGAACCCAGCACTTTTTAT 
GCTCCCACTGTGGTTGAGCTTTATGTTTACAGTCTCAGO^CAACACTTATGCATCCAAACACTCACA^ 
TGAAACCTGAAAGAATCTTTTCTGAGCCTCTTAAAAGAGGAAAATGATGATAACATTAAAGACTCTGAAC 
ACCCAAGGTTGGTGTCACATATAAAAATTAAGCTGATGACTTTGCAGTGACTCAAGTTGTCTCTTTATCA 
TGGTTTACCAGGTAGAGTGCCTGGCTATTACTATATAATGAAGCCCACTGGCTTGACTTGTAAGTTCAAC 
CTAAACCACAATCCTAGACCATCATGGATTTAGGAGTAGATTCTTCTTGAAATCCCACATCCAGAAACTA 
GACATTAGAATGTTGAGGCAGTTTCCCAGAGAAACAAGCATATTGCCTCATGGATGAAAGACTTGTAGTT 
CTAGTTTCAGTGACTTGTTATATCTACTTACATACAACAGGGAGGCAAGAGGATTCTCTGTCATCTCTGG 
TGACTGAGTGTAAAATATGTGCCAAGTCTGCAGCACAGTGACCAAATCTGACAATCGAGCTCTGGATCAC 
CACTTGATTATGTAGTAGACTCATTTATAAAGCAGCTTAGGAACTAATTAAACATGGAGGATGAATTACC 
TTCCTATCCCTTGAGATAAGACATCTTTCAGTTTCATGATTAAGGATTGTTGCTGTTTTATAGTTACTCT 
GTTCATCACAGTGTAAATGGTGATGCGTGTCGTAGGTGTGCAGCTATTTGAGGGACTAAGGGATGGAGAT 
ATTCTGTCAAATGAATCTCTTCAGTATACCAGTTTGTGGGAGGGATATGAGACATGTGGATGGCAGTGAG 
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AGATCGTGCCTCTAGATCTTGATGGAGGCTTGGTGAGACACACTTAAATAAGCACGTGGAGGTTAGAATA 
GAGGGCAGAGTAAAAGGAAGCTCCATCTGAGCAAGTACACCAAATGATCTCAGCCCTGCAACTTGACCCA 
GGTAGGGCCACCACTACGCCTTCACTTGTCACCCAAGCTCCAACCACAGAGAGTTTGACAAGTTTGTGTT 
ATGATGTTGGCTTGGCTTTGTATTTTTAATTAACTTTGGATTTTTAGTGGTTTTGTCATATAACTGTCTG 
AGTTTGGTAGGTAGGATTACTTTGAAAAGGGTTTACTAGTGTGGTCCTCCGGGTAGAATTTAGCTGTAAC 
ATGTTGTTAGCCAGCCTGTAGACTGTTAATTACTTAATAATCTCATTGGGAAAATACTAGTAGTTTTATA 
TTTGGATGACATAATTGGAAAAAGCAGATTAGCTGCTACTACTTTTAAAAGACTTAAGGTCGGGATGCCT 
TTTTTTCCATGTAAGGAAATGAAAAGACCCAAAATCTTCAGGCAAAAAGCAAGTTGCAAAATTAGAAACC 
ATTGGCTAAAAATGTGTTTTGTTGAGTTTCCAAATGGATGAATTTTCATTTGGACATTACATCACTAAAT 
TCATTAGATTTTGTCTGCATTGGAAAGATACTCTTCTAGCATATCTTTCCCAAAGATATCTAATTTGGAT 
TCTGTTTCATGCAAATTTGCATCCCGGAGGTTG7UVGTTGGAGTTTGAGGTTGGAAAATATCTTTGAAGGC 
AGAATCAGTTGAGTTGTGAGGGTGAAGCCTCACATACTTCTCAACAGACATGATAAAATTCACCTGCATG 
AGTTGGCAGGTGGGAGAACCAAACTGGATCACTGGGTAAGACTACTCAGTAAAGCAATGAACTGCTTGCT 
TAGAGAAGCATC ACTATCC C CATTGAGAAAAATGTGTGGCAAGATGATAC AGCTACACAGTAT CAAATGA 
ATGGGTCAATTCAGCACCCCCAAATTTAATTCTGTGGGGAAAAATTATTGAGCCAGTTGTCAGTGTTCTG 
TTACATGACTGGCAGACTAAATTCTTCATCGTTGTTGTTATTGTTGTTGTTGTTTCTCATTTTCACTCGC 
ACGGCCTTATTCTCATAATTAAAATCTAATTCATTTTCTCTTTAGTGTTAGTAGACTCCAACAACAGAAG 
TGGCATCTGTGTATTCATAATCAGCATTTACCCTGGCAGGAGACTAATCAGATAGGCCGGTCTCAGACAT 
TAATCCTACCATCTGATATTTTTGGTGAAGGAAAAAGTATTAATTCTCTTTCCATCCTCCTCCTCAGAAA 
TATAGAAGCCCTCTTTACCAAAATCATCACATTTTACTCTGTAATCTACCAGCTAAAAGAAAATTGCATT 
GAAGCCCCACAAAGCCAGATTGCAGTTCTTGCCCCTTTTTGCGTCTGACATGAGATGTTAAAGAATTATT 
CATTGTGCTCACATTGGGTTAGGGGACACTGAACTGCTTTTTAGATCCATGATCAGTCATCATTCTTCTA 
AGAGATTGGAGCTTTGCTGTTTCATTAACTGTGCAGTGTAGACTAATGGTGTTTAATAAAAATCATTCAA 
AATTTCAAACTCTTTTGCCAGTGACCTCAATTTTGTTGGCTCTGTGATTTGTATCAGACTTTGAGGAGGG 
AAGGGGGAAGTGAAGGAAGCCTACGTCCAGGCCCCTGACAGGATGCTGCAGTAGCAAGCTCAAGCTCGCC 
TGCCTGCCAGCAGTTGCTGGTGAGCAGCAGCATGCAGACCAGCTGTGGGAAGCCTCCTGAAGAATGCCCC 
AGCTGATGCTTTCAGCTGGGAATAGTTTGTTCCTATTGGGGAACTCATTGTTCTCCAGTCTCTGCAGCAG 
GAAGCCAGCTGTCATATTCGGAGGGAATTTCAGATGCTTTACCTTTTTGGTTTTGTCCTGCATCACTCAT 
GTGGCTACGAAAGTGTCTCTGAGAATAGAGC C CAATGTGGTGACAATGGGTAGTCAAATG CACCC CAGAT 
GCTCAAGCCCTGTTGTGGTTCTGCAGTGTTTATGAAATTGGGAGGAAGGAGACCCTGGACAGTAAGCAAA 
ATTGGAGACACTCCAACGAGGCTAAGTTAATGCCGTGTTGCCCAGAACAAGATCTAGCTTCTCATTTGGT 
CAGCCTAGCATGCAACCAGTGGTGTGCTGGTAAAATGTTTAACAACCAGCTCGCTGAGAATAGAAAGCAC 
CTGGTTTGCACCATTTGCCAATTTCCATGGCATAAATACTACCACTTTAGATGATTTTAAGCTACCAACT 
GTGATGTCACTGAACACATGGTTGGAAAGAGATGCACGCAGTTGGCTCTTGCAAGCCTGGGCAAAAATGC 
TTCAAC^CGCC^CTGGATGCAGCCAGTCAGAGGGTTCATATTTAATATATGTGTTCATGTGGACACACAC 
AGACACACACACACAAACTCACCCTTACACACACACTTCGATGACTAAAACAATTACATAGTTTTAAGAT 
ATGAATCAATGTGTGAATGTAGAAAGCTTATGATAAGGC CCTAGAGGTATGGGTTGCCCTGGAAGC CTAG 
GTTTTAAGCAGGAGAATAGCTGAGAAGAATGAAGCCCTCCTGAGCTGAAAGGAGAGATGGATCAATGGAG 
ATGGTTCCATCATCTCCTTCCATATCTCACAGGTAAAATGGGCACTCAGAAAACCCTCACGATTGATTTT 
TTAAAAAGATAAGTGAGTGTTTTTTATTTTATTATTATTGTCATCATTATTTTGATTTACAAATGCTATT 
TGTAACTTTTACATGTAACTAGGATAAAGTATTTACGGGAACTCTATGGAGAATAGCACAATCCAGAATT 
TACTGTGTTTTTCTTTTATGTGACGTGGAAACTCAGTAATTCTCCCACCTTCACATTGTTGTTCATAAGA 
ATTTTACTTTAGTTATTAGGGAATCTAAGTTTTTTGTTT^ACATTTGTTTTTAGTTAAAAGTATCTACTTA 
CTGTTTTAGCTCTGAACTCAAACCAGAATATCTCTGTATCAATTGCATGACTATTCAGAAACAATAATCC 
AAACO\AAATAATTCTTTTTCC^CCCAGT^^ 

AGTATATAATGAGGCTTTCATTAAATACACACACACACACACTCACACACACACACATACACTTTTTAAA 
TTTTTAAATTAGGCCTCCACACATAAATCATTTTGAAAGTAGAATAGAAAATCTCAAAGAATTCATTCTC 
CTGGTCCTGTGCATCTTCTGCAGTTAATAAGAGGTTTGTATCTGGAAAGATGGAAGAACTTGTTCTAAAA 
TCTTATTTTTCAAAAAAAAATTTCCATTTTC 

GGAGATCCATGTCTTACTCGCTCTTTCTGGCCCTTCTGTCTTTTGCCTCTGCAATTCTTTTTGTAGCTGG 
CACGATAGCAGGGACTGGGGGTCTATCCTTTCATGGTATTGCTACAATATTTGTCCTTACTGGAAAATGG 
TAACATCCGGGTCTGATTTAATTGGCATTACACTTACACAGGGACTCTGAGCACCCCCGTCACCACACCA 
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GACAGTGGAC CAGTTTT CACAGCTACAAAGAGCTAGAAATGTGTTTAACATCAT C CAGTG CATC C C CTAA 

TTC AAAACCATC CTCACTAATCAATCATATTC A CC C ATAAATATTACAAATGAGATTGATTC CAT CTCAA 

GACAATTTGTCAAATACTTAATTTTCTTCCTGGATGATTCTACTTACTGGATATTTTAGAAAGAGAAATG 

TCTGAGATAAAATCCCTCACATTTACTCAATATAACAAATTACTGTTTCTACTCCTATTCTGAGTAGTGC 

TTCTGAAGATTGTTTGCTGTAGTGTTGTCTTTGATAAAATGAATGTCAGTAGTGAGCCTTTTAGAGATAC 

CATGCTCAGACATCCTCTTTGGGATCAGAAGATACCTAAAATTCTCCCCTTTTGCCCACTTGGTTAGATG 

AGTGATATATTCTTTGGATCCTGCAAAGAAGAGATTGGTTTCTTTTCTTTTCTGGTGGTGGTAGTGGTTG 

TATCTGTGGCTGTGATGGTTGTTGTTACTTGTCTCTCTCTCTCTCTGGCTCTGGCTTTTGCTTTCCTGCT 

AGTGTTCTTTCTCTTTCCAAACAAATAGTTAAATTAAACGTGAGCTTCTGAATTGTACTTGTTCATACTT 

TCAAAACATAACAGATTAATAAAAATAGATGTGTCCTGATTTAAAACATGCCCCCTGGAAAGGCATGCTG 

TATTATGAAATCGTGATAATATAACTGCATTATTACATGGCAGTATAAATATTAGTCTGTTGAATTCATT 

TGTCCAATTGTATAACTTTGTGGAGCAGTGTTTTGACCTTTGATACATAATTCTGGAGCAAGTGGAGTGG 

TTGCAGGCAGATGAGACAGTGTTATATCAGGATTTTTCAATCAACTTTAGTTGGAGGCCTGGCAATTACA 

AACATCTTCA.GATGTTTCTGTAACCATTATAAATATGAAAAAAACCTCTTCAAAAAATTTCCCATAGTAC 

TTCAGTCAAGACTTTTTAGGTTTATCTTTTTTTTTTCATTTCTCCTTTTCCTTTTCCATTATTTTTCGAT 

GGGGGGGTTGTTATCATTGACTGAAGAAATATTTTGATTGCAATGGTCTCTCTCTCTCTCCCCCTCTCTC 

TCTCTCTCCTCTATTCTTTCCTCCTTCCCTCTGTCCATCACCCCTCATTAAAATATTGAAATCTGGAGTC 

TTTGATAAATCTGCATTAGACCAGGCTATATGCTAGGAATGAAATCTGGGCAAATATCGATGGGTTTTCA 

AAGAATGCTCCATGTTCATTGGGCCCTTTCACACCCCACAGTGATAAATGAAAAGGATAGAGGTAGTTTT 

TTCAAAAGAGCACTTTAATAATATCCTCTGAGACCTAATGCAGTTTAACAAATGACTCCACCTATTTTTC 

CAGTAGGTAAATTGACTGAGACTTGCAAAATACCCCTGAGAGTTGTCAGGGGTGTCTTCTGCCTGGTCTA 

TAGCGTGTGTGTTTGCTTTGTATCTAACAGGCACATTCACGTCTCGTGTACTCATATGAAGTATTTCCTA 

ACATTCCCATTAGCCTGTATATAAGAATCAGAAAGATAATCCCAACATGTTGTAAATGAAGATGTGACTC 

TATAACCTTTCTCTTCTTCCTGGAAAAAAAAGGACATTTTCATGCATATTTTAAACAGAAA.TTTTGTATA 

TTTAAGTGTCATAGAAAATATTTATTGAGTAACTGGGACACAAATGGGAATTTAATTGTCATCATATGCT 

TTGTGTGTGGGGATGCTTACCAACACCATGTCGCTGGACCATTGTGGCAAGCCATAACTGCACAAAGAGT 

ACACATCGTCAGTGTGTGTGTGTGTGTGTGTGTGCGCGCACGCACGTGCGTGTGTGTGTCCCTGCATGTG 

CAACATGTCTAGCTTGCTGTCCTTCATGGGATTTTAGCTTTCCCTTCTTGAAAAACATTATTTTACAGTT 

CCAGGAGGCCCTGGTTACATTACTATATGAAGGCAGTGATTTGAAATGAAAATTCCTTTCCTCTTGGAAG 

CTTTGGTCATAATATCATGGTTCAATTAAACGGATTCCACCGGACTTTGTGATGAAAAAGGCTCTGTTAA 

AATCCAATTGAGTTTCCAAGAGGAAATTGTAGTAGGTCAAGATGCATGAGAGGGAAGATGGAGGCCACCT 

CAGCTGGAGAACATGAGCTGAGTTGAGCCCTCAGTGTTGAAGTTGACTTGCTCCAAGCTGCAGTCTAAAA 

CCCTGGGGCCCGTGCCTGGCCTATGCTCCCTCCCAAGTAAGTAGAGGAGCAGAACCATCAGGAACAGCCT 

GCCTGGCTCCTATGAAGAAAACTTCCTGACGTCCTGTCCCCAAAGGAAGACCCTTTCCCCAAGGGCACCC 

CAGGTGGCCATTAAATTGTGATGATCATTCAGAAAGTGCCCCCTTGGCTTTATGAGAATCCAATTAGTCT 

TCTGAACCACCTTTTCTTGGGTGCAGATTTCCAACATTCATGCTCATTGCAGATCCACCAACTGTCACTG 

TTCTTAACAAGCATGCTCGTCTTGTCAGAATTTCAGTAAGTTCCAATTTCCTGTACAGACCAGGGTAAAC 

TGTTCTAAAATCAATCAATTAATGAAATGTTATCTGGTTTTTAAAAGCTGGTTTCATGTGCTTTATGTGT 

ATAAAACTATATCTGCCTGTGTGGCTTTGCATTTCAAATGTGTGGCGCACAAGCGTTTTGTTGGTGCTTT 

GTTCTCAGTACAGTAACTCTGTGTACAAACATTTTAATGTGGTTTTGTTGTTTTCCAACAAGATGTCTCT 

GTAAAAATGATATTGGCTGAGCTGGTGCGTTGGTTTCTCTCATAGAGGCATTAACTATACTGCCAATGCA 

TTGAATTATTTAAAAATGCAAAATAAAATTTTTATGAAAATCTCA 
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LISTE DE SEQUENCES 

<110> INSERM 

ALLIEL, Patrick 
PERIN, Jean-Pierre 
RIEGER, Francois 

<120> FAMILLE DE SEQUENCES NUCLEIQUES ET DE SEQUENCES 

PROTEIQUES DEDUITES PRESENTANT DES MOTIFS RETROVIRAUX 

ENDOGENES HUMAINS, LEURS SEQUENCES FLANQUANTES ET LEURS 
APPLICATIONS. 

<130> 598EXT21 

<140> 
<141> 

<150> 9807920 
<151> 1998-06-23 

<160> 122 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 2599 
<212> ADN 

<213> Homo sapiens 
<400> 1 

atcccctgcc ttaatcgcca agctccttca ggagaacaaa gaacaggcca ttaccctgga 60 

gaagactggc aactgatttt acccacaagc ccaaacctca gggatttcag tatctactag 120 

tctgggtaga tactttcacg ggttgggcag aggccttccc ctgtaggaca gaaaaggccc 180 

aagaggtaat aaaggcacta gttcatgaaa taattcccag attcggactt ccccgaggct 240 

tacagagtga caatagccct gctttccagg ccacagtaac ccagggagra tcccaggcgt 300 

taggtatacg atatcactta cactgcgcct gaaggccaca grcctcaggg aaggtcgaga 360 

aaatgaatga aacactcaaa ggacatctaa aaaagcaaac ccaggaaacc cacctcacat 420 

ggcctgctct gttgcctata gccttaaaaa gaatctgcaa ctttccccaa aaagcaggac 480 

ttagcccata cgaaatgctg tatggaaggc ccttcataac caatgacctt gtgcttgacc 540 

caagacagcc aacttagttg cagacatcac ctccttagcc aaatatcaac aagttcttaa 600 

aacattacaa ggaacctatc cctgagaaga gggaaaagaa ctattccacc cttgtgacat 660 

ggtattagtc aagtcccttc cctctaattc cccatcccta gatacatcct gggaaggacc 720 

ctacccagtc attttatcta ccccaactgc ggttaaagtg gctggagtgg agtcttggat 780 

acatcacact tgagtcaaat cctggatact gccaaaggaa cctgaaaatc caggagacaa 840 

cgctagctat tcctgtgaac ctctagagga tttgcgcctg ctcttcaaac aacaaccagg 900 

aggaaagtaa ctaaaatcat aaatccccat ggccctccct tatcatattt ttctctttac 960 

tgttctttta ccctctttca ctctcactgc accccctcca tgccgctgta tgaccagtag 1020 

ctccccttac caagagtttc tatggagaat gcagcgtccc ggaaatattg atgccccatc 1080 

gtataggagt ctttctaagg gaacccccac cttcactgcc cacacccata tgccccgcaa 1140 

ctgctatcac tctgccactc tttgcatgca tgcaaatact cattattgga caggaaaaat 1200 

gattaatcct agttgtcctg gaggacttgg agtcactgtc tgttggactt acttcaccca 1260 

aactggtatg tctgatgggg gtggagttca agatcaggca agagaaaaac atgtaaaaga 1320 

agtaatctcc caactcaccc gggtacatgg cacctctagc ccctacaaag gactagatct 1380 

ctcaaaacta catgaaaccc tccgtaccca tactcgcctg gtaagcctat ttaataccac 1440 

cctcactggg ctccatgagg tctcggccca aaaccctact aactgttgga tatgcctccc 1500 

cctgaacttc aggccatatg tttcaatccc tgtacctgaa caatggaaca acttcagcac 1560 

agaaataaac accacttccg ttttagtagg acctcttgtt tccaatctgg aaataaccca 1620 

tacctcaaac ctcacctgtg taaaatttag caatactaca tacacaacca actcccaatg 1680 
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catcaggtgg gtaactcctc ccacacaaat agtctgccta ccctcaggaa tattttttgr 1740 
ctgtggtacc tcagcctarc gttgtttgaa tggctcttca gaatcrargt gcttcctctc 1800 
attcttagtg ccccctatga ccatctacac tgaacaagat ttaiacag-: atgtcatatc I860 
taagccccgc aacaaaagag tacccattct tccttttgtt ataggagcag gagtgctagg 1920 
tgcactaggt actggcattg gcggtatcac aacctctact cagtrctact acaaactatc 1980 
tcaagaacta aatggggaca tggaacgggt cgccgactcc ctggtcacc: tgcaagatca 2040 
acttaactcc ctagcagcag tagtccttca aaatcgaaga gcttragact tgctaaccgc 2100 
tgaaagaggg ggaacctgtt tatttttagg ggaagaargc tgttartatg ttaatcaatc 2160 
cggaatcgtc actgagaaag ttaaagaaat tcgagatcga atacaacgia gagcagagga 2220 
gcttcgaaac actggaccct ggggcctcct cagccaatgg atgccctgga ttctcccctt 2280 
cttaggacct ctagcagcta taatattgct actcctcttt ggaccctgra tctttaac.cr 234 0 
ccttgttaac tttgtctctt ccagaatcga agctgtaaaa cracaaatgg agcccaagar 2400 
gcagtccaag actaagatct accgcagacc cctggaccgg ccrgctagcc cacgatctga 24 60 
tgttaatgac atcaaaggca cccctcctga ggaaatctca gctgcacaac ctctactacg 2520 
ccccaattca gcaggaagca gttagagcgg tctcggccaa cctccccaac agcacttagg 2580 
ttttcctgtt gagatgggg 2599 



<210> 2 

<211> 1326 

<212> ADN 

<213> Homo sapiens 

<400> 2 

gccgcctggc actcctgagg gaagtataaa ttataacacc atcttacagc tagacctctt 60 
ttgtagaaaa ggcaaatgga gtgaagtgcc ataagtacaa actttctttt cattaagaga 120 
caactcacaa ttatgtaaaa agtgtgattt atgccctaca ggaagcctrc agagtctacc 180 
tccctatccc agcatccccg actccttccc caactaataa ggacccccct tcaacccaaa 240 
tggtccaaaa ggagatagac aaaagggtaa acagtgaacc aaagagtgcc aatattcccc 300 
aattatgacc cctccaagca gtgggaggaa gagaattcgg cccagccaga gtgcatgtgc 360 
ctttttctct cccagactta aagcaaataa aaacagactt aggtaaattc tcagataacc 420 
ctgatggcta tattgatgtt ttacaagggt taggacaatt ctttgatctg acatggagag 480 
atataatgtc actgctaaat cagacactaa ccccaaatga gagaagtgcc accataactg 540 
cagcctgaga gtttggcgat ctctggtatc tcagtcaggt caatgatagg atgacaacag 600 
aggaaagaga atgattcccc acaggccagc aggcagttcc cagtctagac cctcattggg 660 
acacagaatc agaacatgga gattggtgct gcagacattt gctaacttgt gtgctagaag 720 
gactaaggaa aactaggaag aagtctatga attactcaat gargtccacc ataacacagg 780 
gaagggaaga aaatcctact gcctttctgg agagactaag ggaggcattg aggaagcgtg 840 
cctctctgtc acctgactct tctgaaggcc aactaatctt aaagcgtaag tttatcactc 900 
agtcagctgc agacattaga aaaaaacttc aaaagtctgc cgtaggcccg gagcaaaact 960 
tagaaaccct attgaacttg gcaacctcgg ttttttataa tagagatcag gaggagcagg 1020 
cggaacagga caaacgggat taaaaaaaag gccaccgctt tagtcatgac cctcaggcaa 1080 
gtggactttg gaggctctgg aaaagggaaa agctgggcaa attgaatgcc taatagggct 1140 
tgcttccagt gcggtctaca aggacacttt aaaaaagatt gtccaagtag aagtaagccg 1200 
ccccctcgtc catgcccctt atttcaaggg aatcactgga aggcccactg ccccagggga 1260 
caaaggtcct ctgagtcaga agccactaac cagatgatcc agcagcagga ctgagggtgc 1320 
ctgggg 1326 



<210> 3 
<211> 10499 
<212> ADN 

<213> Homo sapiens 
<400> 3 

ccctggggcg ggcttccttt ctgggatgag ggcaaaacgc ctggagatac agcaattatc 60 
ttgcaactga gagacaggac tagctggatt tcctaggccg actaagaatc cctaagccta 120 
gctgggaagg tgaccacgtc cacctttaaa cacggggctt gcaacttagc tcacacctga 180 
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ccaatcagag agctcactaa aatgctaatt 
atcatctatt gcctgagagc acagcaggag 
tcgagcrggc aacagcagcc cccctttggg 
tgctatttca ctctattaaa tcttgcaact 
cgagctgagc ttttgctcac cgtccaccac 
tgactcccat ccctctggat cctgcagggt 
ccattgccgc tcccaattgg gctaaaggct 
ggtttgttct aattgagctg aacactagtc 
acggcttcta atagaactat aacacttacc 
cgtgaggcca agaactccag gtcagagaat 
tgctaccatc ttggaagtgg ttcaccacca 
ggtaacattt tggcaaccac gaacggacat 
cacttgctat tctgtcctat ccttccttag 
ccagttaaaa acgattagtg tggccaccgg 
gaagggcttt ctaacaaccc ccaacccttc 
gcttccactt tcagttttct tggggaagcc 
cctgaactcc cggcagtagc cggttgagat 
ccatgcatgc acccctatct ttccttctga 
tcttcaaagt gtagccccaa aattctcctt 
ctcctaggta ctattggttc agacttccat 
tctaaggaag ctctgcgctg cgtccttagg 
cctggtgtcc ctcccaattt aggcatacag 
ctccccacca cccttgccag ggccccaagt 
aggagagaga gagaaatgga ggagaaagag 
gagagacaga agagagagag agacaaagag 
gagaaagaaa tagtaaaaaa cagtgtgccc 
acctgtactt gataattgaa ggtcttctct 
ggtcagtgta aataagagca taggccgaaa 
cctatcaaaa atccttaacc cagtaacccg 
gcaactgctt tgctaaaagt agaaaagtaa 
ctcacctgtt cagaattatt ctaataaaaa 
tcttaaagta tggggctatt ctgttagaaa 
cccttaaccc agcagatttc ctaacgggat 
ccagacctag gcggaactcc cttcaggaca 
aggaaaaaaa ccacaatggg tattcagtaa 
tagaaaaatt gcctaataac tggtctcctc 
ccttaaagta cttacagaat caaaagacta 
ccctctctgt aatgcatttg cataagaact 
ctgggttgtt ataaaatagg aacccagccc 
caatgttggg catgctggta aaggaccact 
tggtcaagaa aggcgggaaa aggggtgcag 
gataaacaga ggtccatggg tggttacgca 
aggcaatgtt gggcacgctg gtaaaggacc 
ttgtggtcaa gagaggcagg aaaacaggtg 
ttcgataagc agaggtccat gggtggtgat 
tagaggacac tccaggacta aagctcatcg 
gttctttttt cagatgggaa acgttccccg 
ggagaattgg gaccaatttg accctcagac 
cagtgccgcc tggcactcct gagggaagta 
tcttttgtag aaaaggcaaa tggagtgaag 
gagacaactc acaattatgt aaaaagtgtg 
tacctcccta tcccagcatc cccgactcct 
caaatggtcc aaaaggagat agacaaaagg 
ccccaattat gacccctcca agcagtggga 
gtgccttttt ctctcccaga cttaaagcaa 
aaccctgatg gctatattga tgttttacaa 
agagatataa tgtcactgct aaatcagaca 
actgcagcct gagagtttgg cgatctctgg 



aggcaaagac aggaggtaaa gaaatagcca 240 
ggacaacaat cgggatataa acccaggcat 300 
tcccttccct ttgtatggga gctgttttca 360 
gcactcttct ggtccatgtt tcttacggct 420 
tgctgtttgc caccaccgca gacctgccgc 480 
gtccgctgtg ctcctgatcc agcgaggcgc 540 
tgccattgtt cctgcacggc taagtgcctg 600 
actgggttcc atggttctct tctgtgaccc 660 
acatggccca agattccatt ccttggaatc 720 
acgaggcttg ccaccatctt ggaagcggcc 780 
tcttgggagc tctgtgagca aggacccccc 840 
ccaaagtggt gagtaatatt ggaccacttt 900 
aattggagga aaataccggg cacttgtcgg 960 
acttaagact caggtgtgag gctatctggg 1020 
tgggttgggg acttggtttg cctcaagcca 1080 
gagggccgac tagaggcaga aagctgtcgt 1140 
catggtgtag ccagaagtct caacagtcgc 1200 
cccatacctc ctgggtccca accacaactt 1260 
acctctgaat atacttcctc tgatccctgc 1320 
ttcctctagc aagttgtatc tccaaaggga 1380 
cacctaggct ataacccagg gagtcttatc 1440 
ctcttgacat gggcagttat gtaggaccca 1500 
ttgtaaatgg ctgagggaaa agagagacag 1560 
agagagacag agaggagaga gagacagtga 1620 
gagagagaga gagtcaaaga gagaaagaaa 1680 
tattccttta aaagccaggg taaatttaaa 1740 
gtgaccctat agcactccaa tccactttgt 1800 
gcactgaggc cattgacaac ccgtagcttc 18 60 
cagatggacc aaatgcattc agtcggtagc 1920 
cttttagagg aaacctcatt gtgagcacac 1980 
aagcaaaaag gtagcttact aactcaaaaa 2040 
aaggtaatgt aactccaacc actgataatt 2100 
ttaaatctta attaccatac aaaggtccga 2160 
ggacgataga tggttcctcc caggtgattg 2220 
ttgatacggg gactcttgtg gaagcagagt 2280 
aaacgtgtga gctgtttgca ctcagccaag 2340 
tctcaatcct gattcaaaag gttagctaca 2400 
tgtttatggg aatgcatctt gatggggcag 24 60 
agctctagga ctcacccctg agcgcaaagg 2520 
agaatccagc agcccagacc cctttctttg 2580 
gactgctaca tcggtaagca taactaatcc 2640 
ccctggaaag gaactcaccc ctgagcacaa 2700 
actagaatcc agcagcctgg acccctttct 2760 
caggactgca acatcagtga gcataactaa 2820 
gcaccctgga aagaataagc attaggacca 2880 
gaaaatgact agggttgctg gcatccctat 294 0 
caagacaaaa acgcccctaa gacgtattct 3000 
actaagaaag aaacgactta tattcttctg 3060 
taaattataa caccatctta cagctagacc 3120 
tgccataagt acaaactttc ttttcattaa 3180 
atttatgccc tacaggaagc cttcagagtc 3240 
tccccaacta ataaggaccc cccttcaacc 3300 
gtaaacagtg aaccaaagag tgccaatatt 3360 
ggaagagaat tcggcccagc cagagtgcat 3420 
ataaaaacag acttaggtaa attctcagat 3480 
gggttaggac aattctttga tctgacatgg 3540 
ctaaccccaa atgagagaag tgccaccata 3600 
tatctcagtc aggtcaatga taggatgaca 3660 
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acagaggaaa gagaatgatt ccccacaggc 
tgggacacag aatcagaaca tggagattgg 
gaaggactaa ggaaaactag gaagaagtct 
cagggaaggg aagaaaatcc tactgccttt 
cgtgcctctc tgtcacctga ctcttctgaa 
actcagtcag ctgcagacat tagaaaaaaa 
aacttagaaa ccctattgaa cttggcaacc 
caggcggaac aggacaaacg ggattaaaaa 
gcaagtggac tttggaggct ctggaaaagg 
ggcttgcttc cagtgcggtc tacaaggaca 
gccgccccct cgtccatgcc ccttatttca 
gggacaaagg tcctctgagt cagaagccac 
gtgcctgggg caagcgccat cccatgccat 
cattgagggc caggaggttg tctcctggac 
tgtcccggac aactgtcctc cagatctgtc 
cactagatac ttctcccagc cactaagtta 
ttttctaatt atgcttgaaa gccccactac 
aggggccatt atacacctga acataggaga 
ggaaggaatt aatcctgaag tctgggcaac 
ccgtcctgtt caagttaaac taaaggattc 
cctcagaccc aaggcccaac aaggactcca 
cctagtaaaa ccatgcagta acccctgcag 
cagacagtgg aggttagtgc aagatctcag 
gccagctgta cctagccctt atactctgct 
tacagtcctg gaccttcagg atgccttctt 
cttgtttgcc tttgaagata cttcaaaccc 
ccaagggttc agggatagtc cccatctatt 
atcctcatac ctggacactt gtccttcggt 
cagaaacctt gtgccatcaa gccacccaag 
acatggtttc caaaccaaag gctcaactct 
atccaaaggc accagggccc tcagtgagga 
tcccaaaacc ctaaagcaac taaggggatt 
gattcccagg tatggcgaaa tagccaggtc 
agccaatacc catttagtaa gatggacaac 
ccaagcccca gtgttaagtt tgccaacagg 
aacaggaata gctctaggag tccttacaca 
atacctgact aaggaaattg atgtagtggc 
ggtggcagta gcagtcttag tatctgaagc 
tgtgtggaca tctcatgatg tgaatggcat 
agacaactgt ttacttaaat gtcaggctct 
cacttgtgca actcttaacc cagccacatt 
taactgtcaa caagtaattt ctcaaaccta 
tttgactgat cccgacctca acttgtatac 
tcgaaaagtg gggtatgcag tggtcagtga 
tccaggaact agtgctcagc tagcagaact 
agaagaaaaa agggcaaata tatatacaga 
ccatgcagca atatggaaag aaagggaatt 
tcaggaagcc attaggaaat tattattggc 
acactgccgg ggtcatcaga aaggaaagga 
tattgaagcc aaaagagctg caaggcagga 
cctagtatag ggtaatcccc tccgggaaac 
atggggaacc tcacgaggac agttttctcc 
aaatactttt gcctgcaact atccaatgga 
acttaggcat cgatagcacc catcagatgg 
tcaaaactat caagcagata gtcagggcct 
cttatcgcca agctccttca ggagaacaaa 
aactgatttt acccacaagc ccaaacctca 
tactttcacg ggttgggcag aggccttccc 



4 

cagcaggcag ttcccagtc: agaccc:ca: 3720 
tgctgcagac atttgctaac ttgtgtgcra 37S0 
atgaattact caatgatgtc caccataaca 3840 
ctggagagac taagggaggc attgaggaag 3900 
ggccaactaa tcttaaagcg taagtttarc 3960 
cttcaaaagt ctgccgtagg cccggagcaa 4020 
tcggtttttt ataatagaga tcaggaggag 4080 
aaaggccacc gctttagtca tgaccctcag 4140 
gaaaagctgg gcaaattgaa tgcctaarag 4200 
ctttaaaaaa gattgtccaa gtagaagraa 4260 
agggaatcac tggaaggccc actgccccag 4320 
taaccagatg atccagcagc aggactgagg 4380 
caccctcaca gagccctggg tatgctrgac 4440 
actggtgcgg tcttcttagt cttactcttc 4500 
actatctgag ggggtcctaa gacgggcag- 4560 
tgactgggga gctttartct tttcacatgc 4620 
cttgttaggg agagacatrc tagcaaaagc 4680 
aggaacaccc gtttgttgtc ccctgcttga 4740 
agaaggacaa tatggacgag caaagaatgc 4800 
cacctccttt ccctaccaaa ggcagtaccc 4860 
aaagattgtt aaggacctaa aagcccaagg 4920 
tactccaatt ttaggagrac agaaacccaa 4980 
gattatcaat gaggctgttg ttcctctata 5040 
ttcccaaata ccagaggaag cagagtggtt 5100 
ctgcatccct gtacatcctg actctcaatr 5160 
aacatctcaa ctcacctgga ctattttacc 5220 
tggccaggca ttagcccaag acttgagcca 5280 
aggtggatga tttacttttg gccgcccatt 5340 
cgctcttcaa tttcctcgct acctgtggct 5400 
gctcacagca ggttacttag ggctaaaatt 5460 
acacatccag cctatactgg cttatcctca 5520 
ccttggcgta ataggtttct gccgaaaatg 5580 
attaaataca ctaattaagg aaactcagaa 5640 
tgaagtagaa gtggctttcc aggccctaac 5700 
gcaagacttt tcttcatatg tcacagaaaa 5760 
gatccgaggg atgagcttgc aacctgrggc 5820 
aaagggttga cctcattgtt tacgggtagr 5880 
agttaaaata atacagggaa gagatcttac 5940 
actcactgct aaaggagact tgtggctgtc 6000 
attacttgaa gggccagtgc tgcgacrgtg 6060 
tcttccagac aatgaagaaa agataaaaca 6120 
tgccactcga ggggaccttt tagaggttcc 6180 
tgatggaagt tcctttgtag aaaaaggact 6240 
taatggaata cttgaaagta atcccctcac 6300 
aatagccctc acttgggcac tagaattagg 6360 
ctctaaatat gcttacctag tcctccatgc 6420 
cctaacttct gagagaacac ctatcaaaca 6480 
tgtacagaaa cctaaagagg tggcagtctt 6540 
aagggaaata gaagagaact gccaagcaga 6600 
ccctccatta gaaatgctta taaaacaacc 6660 
caagccccag tactcagcag gagaaacaga 6720 
cctcgggacg gctagccact gaagaaggga 6780 
aattacttaa aacccttcat caaacctttc 6840 
ccaaatcatt atttactgga ccaggccttt 6900 
gtgaagtgtg ccagagaaat aatcccctgc 6960 
gaacaggcca ttaccctgga gaagactggc 7020 
gggatttcag tatctactag tctgggtaga 7080 
ctgtaggaca gaaaaggccc aagaggtaat 7140 
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aaaggcacta 
caatagccct 
atatcactta 
aacactcaaa 
gttgcctata 
cgaaatgctg 
aacttagttg 
ggaacctatc 
aagtcccttc 
attttatcta 
tgagtcaaat 
tcctgtgaac 
ctaaaatcat 
ccctctttca 
caagagtttc 
ctttctaagg 
tctgccactc 
agttgtcctg 
tctgatgggg 
caactcaccc 
catgaaaccc 
ctccatgagg 
aggccatatg 
accacttccg 
ctcacctgtg 
gtaactcctc 
tcagcctatc 
ccccctatga 
aacaaaagag 
actggcattg 
aatggggaca 
ctagcagcag 
ggaacctgtt 
actgagaaag 
actggaccct 
ctagcagcta 
tttgtctctt 
actaagatct 
atcaaaggca 
gcaggaagca 
gagatggggg 
gcctagctgg 
cctgaccaat 
agccaatcat 
agtcttcgag 
ttttcatgct 
acggcttgag 
cgccgctgac 
aggcacccat 
tgcctgggtt 
tgacccacag 
gaatccataa 
ctctgtgagc 
atggtagagc 
cctgccctgg 
tcacttctcc 



gttcatgaaa 
gctttccagg 
cactgcgcct 
ggacatctaa 
gccttaaaaa 
tatggaaggc 
cagacatcac 
cctgagaaga 
cctctaattc 
ccccaactgc 
cctggatact 
ctctagagga 
aaatccccat 
ctctcactgc 
tatggagaat 
gaacccccac 
tttgcatgca 
gaggacttgg 
gtggagttca 
gggtacatgg 
tccgtaccca 
tctcggccca 
tttcaatccc 
ttttagtagg 
taaaatttag 
ccacacaaat 
gttgtttgaa 
ccatctacac 
tacccattct 
gcggtatcac 
tggaacgggt 
tagtccttca 
tatttttagg 
ttaaagaaat 
ggggcctcct 
taatattgct 
ccagaatcga 
accgcagacc 
cccctcctga 
gttagagcgg 
actgagagac 
gaaggtgacc 
cagagagctc 
ctattgcctg 
ccggcaacgg 
atttcactct 
ctgagctttc 
tcccatccct 
tgccgctccc 
catcctaatt 
cttctaatag 
ggccaagaac 
aaggaccccc 
aagaaaacag 
atgtcctatt 
aagtagggct 



taattcccag 
ccacagtaac 
gaaggccaca 
aaaagcaaac 
gaatctgcaa 
ccttcataac 
ctccttagcc 
gggaaaagaa 
cccatcccta 
ggttaaagtg 
gccaaaggaa 
tttgcgcctg 
ggccctccct 
accccctcca 
gcagcgtccc 
cttcactgcc 
tgcaaatact 
agtcactgtc 
agatcaggca 
cacctctagc 
tactcgcctg 
aaaccctact 
tgtacctgaa 
acctcttgtt 
caatactaca 
agtctgccta 
tggctcttca 
tgaacaagat 
tccttttgtt 
aacctctact 
cgccgactcc 
aaatcgaaga 
ggaagaatgc 
tcgagatcga 
cagccaatgg 
actcctcttt 
agctgtaaaa 
cctggaccgg 
ggaaatctca 
tctcggccaa 
aggactagct 
acatccacct 
actaaaatgc 
agagcacagc 
caaccccctt 
attaaatctt 
gctcgccatc 
ctggatcatg 
aatcgggcta 
gagctgaaca 
agctataaca 
cccaggtcag 
aagtaacaca 
aagggccctg 
cctaggtgtt 
tctattacag 



attcggactt 
ccagggagta 
gtcctcaggg 
ccaggaaacc 
ctttccccaa 
caatgacctt 
aaatatcaac 
ctattccacc 
gatacatcct 
gctggagtgg 
cctgaaaatc 
ctcttcaaac 
tatcatattt 
tgccgctgta 
ggaaatattg 
cacacccata 
cattattgga 
tgttggactt 
agagaaaaac 
ccctacaaag 
gtaagcctat 
aactgttgga 
caatggaaca 
tccaatctgg 
tacacaacca 
ccctcaggaa 
gaatctatgt 
ttatacagtt 
ataggagcag 
cagttctact 
ctggtcacct 
gctttagact 
tgttattatg 
atacaacgta 
atgccctgga 
ggaccctgta 
ctacaaatgg 
cctgctagcc 
gctgcacaac 
cctccccaac 
ggatttccta 
ttaaacacgg 
taattaggca 
aggagggaca 
tgggtcccct 
gcaactgcac 
caccactgct 
cagggtgtcc 
aaggcttgcc 
ctagtcactg 
ctcaccgcat 
agaacacgag 
accatgaggg 
gttcctcgaa 
tttctgcctg 
cccaaatcaa 



ccccgaggc: 
tcccaggcgr 
aaggtcgaga 
cacctcaca: 
aaagcaggac 
gtgcttgacc 
aagttcttaa 
cttgtgacan 
gggaaggacc 
agtcttggar 
caggagacaa 
aacaaccagg 
ttctctttac 
tgaccagtag 
atgccccatc 
tgccccgcaa 
caggaaaaa" 
acttcaccca 
atgtaaaaga 
gactagatcn 
ttaataccac 
tatgcctccc 
acttcagcac 
aaataaccca 
actcccaatg 
tattttttgn 
gcttcctctc 
atgt catatc 
gagtgctagg 
acaaactatc 
tgcaagatca 
tgctaaccgc 
ttaatcaatc 
gagcagagga 
ttctcccctt 
tctttaaccr 
agcccaagat 
cacgatctga 
ctctactacg 
agcacttagg 
ggctgactaa 
ggcttgcaac 
aagacaggag 
atgatcggga 
ccctttgtat 
tcttctggtc 
gtttgccgcc 
gctgtgctcc 
attgttcctg 
ggttccatgg 
ggcccaaggt 
gcttgccacc 
tgcaaatgca 
ggcatcagtg 
aagcagatta 
tccccacccc 



tacagagnga 
taggtatacg 
aaatgaatga 
ggcctgctct 
ttagcccata 
caagacagcc 
aacattacaa 
ggtattagtc 
ctacccagtc 
acatcacact 
cgctagctat 
aggaaagraa 
tgttctttta 
ctccccttac 
gtataggagt 
ctgctatcac 
gattaanccr 
aactggrarg 
agtaatctcc 
ct caaaacta 
cctcacrggg 
cctgaacttc 
agaaataaac 
tacctcaaac 
catcaggtgg 
ctgtggracc 
attcttagtg 
taagccccgc 
tgcactaggt 
tcaagaacta 
acttaactcc 
tgaaagaggg 
cggaatcgtc 
gcttcgaaac 
cttaggacct 
ccttgttaac 
gcagtccaag 
tgttaatgac 
ccccaattca 
ttttcctgtt 
gaatccctaa 
ttagctcaca 
gtaaagaaat 
tataaaccca 
gggagctctg 
catgtttctt 
accgcagacc 
tgatccagcg 
catggctaag 
ttctcttctg 
tccattcctt 
atcttgggag 
tgggccacta 
agctgaaatg 
aaccctttgt 
agatgacat 



7200 

7260 

7320 

7380 

7440 

7500 

7560 

7620 

7680 

7740 

7800 

7860 

7920 

7980 

8040 

8100 

8160 

8220 

8280 

8340 

8400 

8460 

8520 

8580 

8640 

8700 

8760 

8820 

8880 

8940 

9000 

9060 

9120 

9180 

9240 

9300 

9360 

9420 

9480 

9540 

9600 

9660 

9720 

9780 

9840 

9900 

9960 

10020 
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10200 
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<210> 4 
<211> 2784 
<212> ADN 

<213> Homo sapiens 



<400> 4 

ctccttcagg 

cccatatgcc 

gttgggcaga 

aaataattcc 

aggctacagt 

cctggaggcc 

taaaaaagct 

taagaatccg 

ggcccttcct 

tcatctcctt 

aagagggaaa 

attccccatc 

cggcagttaa 

tactgccaaa 

aggatctgcg 

cctggccctc 

tgcaccccgt 

agcaagagtt 

gtttatctaa 

actctgccac 

ccagttgtcc 

tggagttcaa 

ggtacatagc 

cd&ftacccat 

ctcggcccaa 

ttcaatccct 

tttagtaggt 

atttagcaat 

acgaatagtc 

tttgaatggc 

ctacactgaa 

cattcttcct 

tatcacaacc 

atgggtcgct 

ccttcaaaat 

tttagaggaa 

agaaattcaa 

cctcctcagc 

attgttactc 

aatcgaagca 

taaaatctac 

caaaggcacc 

aggaagcagt 

agagggggga 

actagctggg 

ccaaccaatc 

aaagaaatag 



agaacaaaga 
caaatctcag 
ggccttcccc 
cagattcgga 
aacccaagga 
acagtcctca 
aatccaggaa 
aaactctccc 
aaccaatgaa 
agccaaatat 
ggaactattc 
cctagataca 
agtggctgga 
ggaactcaaa 
cctgctcttc 
ccttatcata 
ccatgccact 
tctatggaga 
gggaaccccc 
tctttgcatg 
tggaggactt 
gatcaggcaa 
acccctggcc 
actggcctgg 
aaccctacta 
atacctgaac 
cctctttcca 
actatagaca 
tgcctaccct 
tcttcagaat 
caagatttat 
tttgttattg 
tctactcagt 
gataccctgg 
cgaagagctt 
aaatgctgtt 
ggtcgaatat 
caatggatgc 
ctctttggac 
gtaaaactac 
cacggacccc 
cctcccgagg 
tagagtggtt 
ctgagagaca 
aaggtgaccg 
agatactaaa 
ccaatcatct 



acaggccact 
ggatttcagt 
tgtaggacag 
cttccccaag 
gtatcccagg 
ggaaaggtgg 
acccacctcg 
caaaaagcag 
cttgggcttg 
caacaggttc 
caccctggtg 
tcctgggaag 
gcggagtctt 
aatccatgag 
aaatgacaac 
tttttctctt 
gcaccccgtc 
atgcagcgtc 
accttcactg 
catgcaaata 
ggaggactca 
cagaaaaaca 
cctacaaagg 
taagcctatt 
actgttggat 
aatggaacaa 
atctggaaat 
cagccaactc 
caggaatatt 
ctgtgtgctt 
acaatcatgt 
gagcaggagt 
tctactacaa 
tcaccttgca 
tagacttgct 
gttatgttaa 
aacgtagagc 
cctggattct 
cctgtatctt 
aaatcgttct 
tggaccggcc 
aaatctcaac 
gttggccaac 
ggaataacta 
cttccacctt 
gagagctcac 
gttg 



acccaagaga 
atctactagt 
aaaaggccca 
gcttacagag 
tgttaggtat 
agaaaatgaa 
catggcctgc 
gacttagtcc 
accgagagac 
ttaaaacatt 
acatggtatt 
gaaactaccc 
ggatacatca 
acaatgcrag 
cagggggaaa 
tactgttctc 
catgccccgt 
ccggaaatat 
cccacaccca 
ctcattattg 
cttcactcat 
cataaaggaa 
actagatctc 
taataccacc 
gtgcctcccc 
cttcagcaca 
aacccatacc 
ccaatgcatc 
ttttgtctgt 
cctctcattc 
catacctaag 
gctaggcgga 
actgtctcaa 
agatcaactt 
aaccgcggaa 
tcaatccgga 
aaaggagctg 
ccccttctta 
taacctcctt 
tcaaatggag 
tgctagccca 
tgcacaacct 
ctccccaaca 
gatttcctag 
taaacaccgg 
taaaatgcta 



agactggcaa 
ttgggtagat 
agaggtaata 
tgacaatggc 
acaatatcac 
caaaacact c 
tctgttgcct 
atacaaaatg 
agccaactta 
acagggagcc 
agtcaagtcc 
agccatttta 
cactcaagtc 
ctattcctgt 
gtaactaaaa 
ttaccccctt 
ccatgccagt 
tgatgcccca 
tatgccccac 
gacaggaaaa 
accagtatgt 
gtaatctccc 
tcaaaactac 
ctgactgggc 
ctgcacttta 
gaaataaaca 
tcaaacctca 
aggtgggtaa 
ggtacctcag 
ttagtggccc 
ccccgcaaca 
gtagctactg 
gaactaaatg 
aactccctag 
agcgggggaa 
atcatcaccg 
caaaacactg 
ggacctctag 
gttaagtttg 
ccccagatgc 
tgctctgatg 
ctactacgcc 
gcagttgggt 
accaactaag 
gcttgcaact 
attaggcaaa 



ctagatttta 
actttcactg 
aacgttcatg 
cctgctttca 
tcacactgcg 
aaatgacatc 
atagccttac 
ctgtatggac 
gttgcagaca 
tgtccccaag 
cttccctcta 
tctaccctaa 
aaaccctgga 
gaacctctag 
tcgtaaatcc 
tcactctcac 
agctcccctt 
ttgtatagga 
aactgctata 
acgattaatc 
ctgatggggg 
aactgacctg 
atgaaaccct 
tccatgaggt 
ggccatacat 
ccacttctgt 
cctgtgtaaa 
ctcctcccac 
cctatcattg 
ctatgcccat 
aaagagtacc 
gcattggcgg 
gtgacatgga 
cagcagtagt 
cctttttatt 
agaaagttaa 
gaccctgggg 
cagctataat 
tcttttccag 
agtccatgag 
ttaatgacat 
ccaattcagc 
tttcctgttg 
aatccctaag 
tagctcacgc 
aacaggagat 



60 

120 

180 
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300 
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420 

480 

540 

600 
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720 

780 
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900 
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1080 
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<210> 5 
<211> 1799 
<212> ADN 

<213> Homo sapiens 
<400> 5 

gggattctta gtcggcctag gaaatccagc taatcctgtc tctcagtccc cccactcaac 60 
aggaaaaccc aagtgctgtt ggggaggttg gctgacgacc agtctaactg cttcctgcgc 120 
aattggggca tagtaggggt tgtgcagttg agatttcctc gggaggggtg cgttcgatar 180 
cattacaatt ggagcatggg ctagtaggcc ggtccagggg tccacggrag atcttagtca 240 
tggacttcat ctggggttcc atttgaagaa cgatttgtag ctttacaact ttgattctgg 300 
aagagacaaa cttaacaagg aggttaaaga tacagggtcc aaagaggagt atcaatatta 360 
gagctgctag agatcctaag aaggggagaa tccagggcat ccattggctg aggaggcccc 420 
agggtctggt gtttttgaag ctcctctgtt ctacgttgta ttcaatctcg aatttcitca 480 
actttctctg tgacaattca ggattgatta acataataac aacattcttc cgctaaaata 540 
acataataac aacattcttc ccctaaaaat aaacagcttc cccctctttc agaggttagc 600 
aagtctaaag ctcttcaatt ttgaaggact actgatgcta ggaagttaag ttgatcttgc 660 
aaggtgacca gggagtcggc aacccattcc atgtcaccat tgagttcttg agatagtttg 720 
tagtagaact gagtagaggt tgtggtaccg ccaatgccag aacctagtcc acctagcact 780 
cctgctccga taacaaaagg aagaatgagt actcttttgt tgtggggctt aggtacaaca 840 
taattgtata aatcttgttc agtgtaaatg gtcatggggg cactaagaar gagaggaagc 900 
acatagattc tgaagagcca ttcaaacaac gataggctaa ggtaccacag acaaaaaata 960 
ttcctgaggg taggcagact attcgtgtgg gaggagttac ccacctgatg cattgggagr 1020 
tggttgtgtc tacagtattg ctaaatttta cacaggtgag gtttgaggta tgggttattr 1080 
ccagattgga aacaagaggt cctactaaaa cggaagtggt gtttatttct gtgctgtagt 1140 
tgttccattg ttcaggtaca gggattgaaa tgcatggcct gaaatacagg gggaggcaca 1200 
accaacagtt agtagggttt tggaccgaga cctcatggag cccagtgagg gtggtattaa 1260 
ataggcttac caggcaagta tgggtatgga gggtttcatg tagttttaag agatctagtc 1320 
ctttgtaggg gctaggggtg ctatgtaccc gggtcagttg ggaggttact tcctttacat 1380 
gtttttctct tgcctgatct tgaactccac ccccctcaga cataccagta tgggtgaagt 1440 
aagtccgaca gacagtggct ccaagtcttc caggacaact aggattaatc attttccctg 1500 
tccaataatg agtatttgca tgcatgcaaa gagtggcaga gttatagcag ttgtggggca 1560 
tatgggtgtg ggcagtgaag gtggagtttc ctttaggtaa actcctattt gatggggcat 1620 
caatatttct gggaagccgc attcttcata gaaactcttg gtaaggggag ctgctggttg 1680 
tacagcagca tggagggggt gcagtgagag tgaaaggggg taagagaaca gtaaagagaa 1740 
aaatatgata agggagggcc atggggattt acgattttag ttactttcct cacggttgt 1799 



<210> 6 
<211> 1489 
<212> ADN 

<213> Homo sapiens 
<400> 6 

tggtgcttgc cccgggcact ctcagtcctg ctgctggatc atctggttag tggcttctga 60 
ctcagaggac ctacgtcccc tggggcagtg ggccttacag tgattccctt gacacgaggt 120 
gcatggacga gggggcggct tatttctatt tggacaatct tttttaaagt gtccttgtag 180 
accgcactgg aagcaaaccc tattaggcat ttgatttgcc tagcttttcc cttttccagt 240 
gcctccaaag tccgcttgcc tgagggccat gactaaagcg gtggcctttt ttttatccca 300 
tttgtcccat tctgcctgct catcctgatc tctattataa aaaactgagg ttgccaagtt 360 
caatagggtt tctaagtttt gttccgggcc taaggcagac ttttgaagtt ttttcctaat 420 
gtctgtagct gactgagtga taaacttatc ctttaagatt agttggcctt cagtagagtc 480 
agttgacaga gagaggtatg cttcctcaat gcctccgtta gtcactccag aaaggcggta 540 
ggattttctt cctttccctg tgttatagtg gacatcattg aataactcac aggcttcttt 600 
ctagttttcc ttagtccttc tagcacgcaa gttagcaaat gtctgcggca ccaatctcca 660 
tgttctgatt ctgtgtccca gtgagggtct acactgggaa ctgcctgctg gcctgtgggg 720 
aatcgttctc tttcctctgt tgtcgaccta tcattgacct gactgagata ccagagatcg 780 
ccaaactctc aggctgcagt tacggcgaca cttctgtcat ttggggttag tgtctgattt 840 
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agcagtaaca 
tcaatatagc 
ggagagaaaa 
agagagaaaa 
ggcataatcg 
tttggaccgt 
tggggtaggg 
attgcgagtt 
cttcttttct 
gatgccaggt 
tgtctttttt 



ttatatctct 
cattagggtt 
aggcacatgc 
aggtacgtgc 
gggaatattg 
ttgggttgaa 
aggtagactc 
gtctcttaat 
acaaaagagg 
ttctccccct 
ttcttagcat 



ccatatcaga 
atctgagaat 
actctggctg 
act ctggctg 
gcattctttg 
ggggggtcct 
tgagggcttc 
gaaaagaaag 
tctagctgta 
taaagagtat 
ctgagagtca 



tcaaaggatt 
ttacctaggt 
ggccgaattc 
ggccgaattc 
gttagttgtt 
tattatttgg 
ctgtagggca 
tttgtacgta 
agatggtgtt 
atcgttgcca 
aattggtccc 



gtcct aaacc 
ctatttraa: 
tcttcct ccc 
t cctcccacc 
tacccctttg 
ggaaggagtc 
taaatcacac 
tgacacttca 
ataattratg 
ggcggtactg 
aattcccca 



ttgtaaaaca 
t taaagtct g 
actgcgtctg 
gcttggaggg 
tctatctcct 
tgggggargc 
tttttacata 
caccatttgc 
cttccctcag 
cagaagaata 



900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1489 



<210> 7 
<211> 1216 
<212> ADN 

<213> Homo sapiens 



<400> 7 

taaagataca 

gaaaatgggg 

ccgcattctc 

gggtgcagtg 

gggttcagtg 

gccatgagga 

agatcctcta 

ggcagtatac 

accgcagttg 

ggggacttag 

ccctcttctc 

gaggtgatgt 

aagggccatc 

attcttagta 

ttttttaaat 

ctccacgcgc 

gtagccttga 

attatttcat 

gcctctgccc 

ttgggcatgt 

tctcctgaag 



gggattgaaa 
tttcctttag 
catagaagct 
agagtgaaag 
agagtgaaag 
tctacgattc 
gaggttcaca 
agagtttgac 
gggtagataa 
aaggaaggga 
gggaacaggt 
ctgcaactaa 
catacagcat 
aggctgtagg 
gtcgtttgag 
agtgtaagtg 
aaacggggcc 
gaattagtgc 
aaccagtgaa 
gggtaaaatc 
gagctt 



tgtatggcct 
aaaaactcct 
cttggtaatg 
agggtaaaag 
ggggtaagag 
tagttacttt 
ggaatagcta 
tcgagtgtga 
aatgactggg 
cttgactaat 
tccctgtaat 
gctggccatc 
tttgtatggg 
caacagagca 
tgcttcattc 
atattgtatg 
attgtcactc 
ctttattaca 
aatatctacc 
tagttgccag 



gaagtgcagg 
atacgatggg 
ggagctactg 
aacagtaaag 
aacagtaaag 
cctcacggtt 
gcgttgtctc 
tgtattcaag 
tagggtcctt 
accatgtcac 
gttttaagaa 
tctcggtcaa 
ctaagtcctg 
ggccatgcaa 
attttcttga 
cctaatgcct 
tgtaagcctc 
tcttggtcct 
cagactagta 
tcttctcctg 



gtcatatagg 
tcatcaatar 
gtagtacagt 
agaaaaatat 
aaaaaaatat 
gtcgcttgaa 
ctggattttc 
actccactcc 
cccaggatgt 
cagggtgcaa 
cttgttgata 
gcacaaggtc 
ctttttgggg 
ggtgggtttc 
cttttcctga 
gggatactcc 
ggggaagtcc 
tttctgtcct 
gatactgaaa 
agtaatggcc 



tgtgggtggt 
ttccaggaag 
ggcatggagg 
gataagggag 
gacaaggagg 
gagcaggtgc 
gggttccttt 
agccacttta 
atctaaggat 
taattacttt 
tttggccaag 
cttggttagg 
agagttttgg 
ttgggttagc 
ggattgtggc 
ctgggttact 
gaatctggga 
acaaaggaag 
tccctgagat 
tgttctttgt 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1216 



<210> 8 
<211> 976 
<212> ADN 

<213> Homo sapiens 



<400> 8 

agtgataatg 

aaactaatag 

acagactata 

gaattcctaa 

ttggtggtac 

aaggaaaggg 

caggaccctc 

gaaagcaatc 

ttcctcccct 

caatggaaat 



gaatacttga 
ccctcactcg 
agtatgctta 
cttccaaagg 
agaaacctaa 
aaatagaagg 
cattagaaat 
cccagtactc 
caggatggct 
tacttaaaac 



aagtaatccc 
ggcactagaa 
cctagtcctt 
aacacctatc 
agaggtggca 
gaactaccaa 
gcttatagaa 
agcaggagaa 
agccaccaaa 
ccttcaccaa 



ctcactccag 
ttaggagaag 
catgcccatg 
aaacatcagg 
gtcctacact 
gcagatattg 
ggacccctag 
ataaaatgga 
gaaggaaaaa 
acctttcact 



gaactagtgc 
agaaaagggt 
cagcaatatg 
aagccattag 
gctggggtca 
aagccaaaag 
tgtggggtaa 
gaacctcacg 
tgcttttgcc 
taggattgat 



tgagctggcc 60 
aaatatatat 120 
gagagaaagg 180 
gatattatta 240 
tcagaaaaaa 300 
agccgcaagg 360 
ccccctccag 420 
aggacatact 480 
tgcagctaac 540 
agcacccatc 600 
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agatggccaa 
gggcctgtaa 
ctgtatcttt 
aatggttctt 
ggagggggcc 
aaatctcaac 
atcggccaac 



attattattt actggatcag gccttttcaa aactatcaag caggtagtca 660 

agtgtgccaa agaaataatc tcctgcactg caagccatac atttcaatcc 720 

aacctccttg ttaagtttgt ctcttccaga atcaaagctg taaaactaca 780 

caaatggagt ctcagatgca gtccatgact aagatatacc gcagccccct 840 

tgctagccca tgctccaatg ttaatgacat cgaaggcacc cctcccgggg 900 

tgcacaaccc ctactatgtc ccaattcagc aggaagcagt taaagcggtc 960 

ctcccc 976 



<210> 9 
<211> 942 
<212> ADN 

<213> Homo sapiens 



<400> 9 

agaggagaac 

agagaaagag 

aaagtcaaag 

gacacagaaa 

ggagaaagag 

cagggtaaat 

tatctgcctc 

aatagactct 

tgaaaaagga 

ggggatagta 

cctttcaaat 

tcctgtggca 

caaatttgtt 

ccaaaagagt 

ccctggccta 

atccagcagg 



agcagcataa 
aaagagaaag 
aggtagtagt 
gtcaaaaaaa 
agagatagaa 
ttctatctac 
tcagacagtt 
ttggcagcag 
ggacactaca 
tgagatgctg 
tcttatacca 
gccatcttgc 
tcctctagaa 
tcaactaaca 
gagagttccc 
agtagctaga 



gcggctggca 
tcagagaaag 
cagaaacaga 
aagttaagaa 
gtagtaaaga 
ccagccaagg 
tgcaagaaat 
tgactctcca 
ccttcttagg 
cccggagttt 
acttctggag 
tgttactcgc 
tcgaggccat 
acttctaccg 
ctctgaagga 
gtggtcatcg 



gaggtaggga 
agacagagag 
gacaaaaaaa 
gaaaggaaaa 
aaaaaacagc 
catattctac 
aatgaaatct 
aaactgcaga 
ggaagaatgt 
acaggaaaag 
ttaggcaaca 
ctttgggccc 
caagctacag 
aggacccctg 
caccgcaact 
gccaaattgc 



aagaccagca 
aggaagagac 
aggagtcaga 
gacaaagaag 
atatcccatt 
ttatgtggar 
atccttactt 
ggcctagacc 
tgtttttaca 
gcttctgaaa 
tggcttctcc 
tgtattttta 
atggtcttac 
gatcaaccca 
T^pfirgggccct 
ca 



agaagaaaag 
aaagagacag 
aagagggaca 
aagtcgaaga 
cctttaaagc 
cttcaaccca 
tacaatccca 
tcctcactgc 
ctaaccagtc 
tcagacaacg 
cctttctagg 
accttcttgt 
aaatggaacc 
ctggcacttc 
tctttgcccc 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

942 



<210> 10 
<211> 1375 
<212> ADN 

<213> Homo sapiens 



<400> 10 

ccccaatatt 

actatcctgc 

gtccaagctt 

cccacaggag 

attgatgata 

aaaggtccac 

gaatttggcc 

cagacctggg 

ggcaaacctt 

ttaatgaaaa 

gtcaagtaaa 

ccatccccag 

aacatctgtt 

attcaatgat 

ggctacaaga 

tgattctaaa 

agcaagccct 

tctataatag 

cagccttagt 



ctctttctga 
agcttgatct 
tcttttcatt 
gacccctcag 
ctcctcctct 
aaaaaccccc 
caacccgggt 
gaagttttca 
tgacctcact 
gaatgcggct 
tgaaagaatg 
tatggatccc 
gatctgtgtt 
atccaccata 
ggccttaaga 
agataagttt 
gagccctgaa 
ggaccaagag 
catggccctc 



tggggaaaaa 
tttctgtaag 
gagggagaat 
cttaccccca 
aatctcccct 
gggctatcgg 
gcatgtcccc 
gatgatcctg 
tggagagacg 
ttagctgcag 
acagccgaag 
cactgggact 
ctggaaggac 
acccagggaa 
aaatatactc 
attacccaat 
caaaatctag 
gaacaggccc 
agacaaacaa 



tggccacctg 
agggaaggca 
acacaactat 
tatcctagcc 
gcccagaagg 
ttatgtcccc 
ttctccctct 
ataggtacat 
tcatgctact 
cctgagagtt 
aaagggacaa 
ttgactcaga 
taaggagaat 
aggaagaaaa 
ccctgtcacc 
cagccacaga 
agacattatt 
aaaaggaaaa 
accttggtgg 



agggaagcac 
aatggagtga 
gcaaagcttg 
tccctatagc 
aaataagcaa 
ttcaagctgt 
ctgatttaaa 
agatgtccta 
gttagatcaa 
tggagatacc 
cttccctact 
tcatggggac 
tgggaaaaag 
tccttctgcc 
cgaatcactc 
tatcaggaga 
aaacctggca 
gcgagatcag 
ttcagagagg 



aaattacaat 
aataccttat 
caatttacat 
ttcccttcct 
agaaatctcc 
agggggaggg 
gcagatcagg 
cagggtctag 
accctggcct 
tggtatccta 
ggtcagcaag 
tggagtcgta 
cccatgaatt 
ttcctcgagc 
gagggtcaat 
aagctccaaa 
accttggtgt 
agaaaggccg 
tcagaaaatc 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 
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gagcaggcca atcacctggt acggcttgtt 
aagattgtcc aataagaaac aagctgcccc 
actggaaggt gcactgcccc agaggatgaa 
tgatccaaca acaggactga gggtgcccgg 



10 

atcagtgcgg tttactagga cactttaaaa 1200 

ctcatccgtg tccactatgc cgaggcaatc 1260 

ggttccctgg gttagaagcc cccaaccaga 1320 

ggcaagcacc agctcatgtc atcac 1375 



<210> 11 
<211> 944 
<212> ADN 

<213> Homo sapiens 
<400> 11 

acctaggagg aactgtcttc aggacaggac tatagatgct tcctcccagg cgattaaggg 60 
aaaaagacac aatgggtatt cagtaagtga taaggaaact cttgtagaag cagagttagg 120 
aaaattgcct aataattggt ctgctcaaat gtgcgagctg tttgcactca gccaaacctt 180 
aaaagtatta cagaatcagg aagaagccat ctataccaat tctaagttaa tatggactga 240 
acgagaactt attaatagca aagaataatt gaaatcccaa acttacaagg ttttcaacaa 300 
aagcacagtt tgctaaaagt taactgtgta acatgtatta tcctactacc acaaactctc 360 
aaatgatttc tcagacagtt tgcaagaaac aatgaaacct atccttactc tacaatccca 420 
aatagactct ttggcagcag tgactctcca aaaccaccaa ggcctagacc tcctcacrgc 480 
tgagaaagga ggactctgca ccttcttagg ggaagattgt tgtttttaca ctaaccagtc 540 
agggatagtg tgagatgcca cccagcgttt acaggaaaag gcttctgaaa tcagacacaa 600 
tgcttttcaa accttatagc aacctctgga gttcggcgac tggcttttcc cctttctagg 660 
tcctgtgaca gccatcttgc tattactcgc cttcgggccc tgtattttta acctcctcgt 720 
caaatttgtt tcctctagga tcgaggccat caagctacag atggtcttac aaatggaacc 780 
ccaaatgagc tcgactaaca acttctactg aggacccctg gaccgaccca ctggcccttt 840 
aactggctta aagagtttcc ctctggagga cactacaact gcagggcccc ttctttgccc 900 
catccacagg aagttagcta gagcagtcat cacccaattc ccaa 944 



<210> 12 
<211> 963 
<212> ADN 

<213> Homo sapiens 
<400> 12 

tacaggaacc ccataatacg tccttggcaa 
cccatttgtc ctgaaccctc aaatcatggg 
ccttatgagt tttcagctac aggggtgtat 
tggaagatcc ttctatattt gcctccccac 
catagtacct cctgtgactt atccttttca 
aagcttcagc cgagagcaat ctcactactt 
acctaggaag tggactcaca gcctagatga 
ccaaatagac tcattagcag ctgtggttct 
cctcactgcc gaaaggggag gaacatgcct 
caataaatca ggcatagtga gagatggaat 
acatggtggg acaaccgaaa ctacctcagg 
tccattttta ggtcccttcc ttatgattat 
cagttccttc atcctttcgt ttcttcctga 
cagatggaac ctcagatgac ttcaaccagc 
gccggcccat acccggacgt tgacacccaa 
gaaccccttc tatgccccta ttcagcagga 
caa 



attctattca gctccaactg ctaggagtgg 60 
aatgagaaat gaatttagac tgaccacagc 120 
agaaccctga taaggagttt tctttgtgtg 180 
caactggaca ggaacttgta ctttagccta 240 
gaagaggcag tagctgtgcc cattcatgct 300 
cctctattgg ctggtttagg atttactacc 360 
aatctctctc caacttactc aaatccagga 420 
ccgaaccagt gagcactaga tctccaatct 480 
ttttctgaac aaggaatgtt gtttttatgt 540 
taaatgactt caggatagag ctagcagact 600 
gttctcacag cctgttctcc actggcttct 660 
tctaggagta acctttggcc catgtctttt 720 
atagaatcaa tgaaactaga aatgttactg 780 
acctattatc aaggacccct aaaccagcct 840 
accacctctc acgaggaaac ctcagctaca 900 
agcaattaga gtggtcatcc tcccacaccc 960 

963 
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<210> 13 
<211> 1362 
<212> ADN 

<213> Homo sapiens 
<400> 13 

ccacaatatc ctcttccagg aggagaacga 
accatcctgc aactagatct gttttgtaaa 
gttcagacct ttttctcatt aagggatgat 
caccccacag ggagtcctca aattctaccc 
actaatgcca aaccctctct ggcttctaca 
agagagccaa gagaccccac tggcccctgg 
tttggcccaa cccgagtaca tgttcccttt 
gacttggatg aaagttctca gatgacccca 
gacaatcttt tgacctttcc tggagagaga 
taatgagaag aatgctgctt taacaggagc 
ttaagtaagt gatagaatga catcagaaga 
cccagtatgg atccccactg ggaccctgac 
ttactgacct gtatcctaga agggttaagg 
atgatgtcta ctataaccca agggaaggaa 
agggaggctt tgagaaaata tactcccctg 
ttaaaggaca aatttattac tcagtcagct 
gccttgggcc gagcaaaatt tggaggcatc 
tagggaccaa gaggaacagg ccgaaaagga 
agtcatgccc tcagacaaac cttggcggtt 
cacccagcag ggcttattat cagtgcagtt 
agagaaataa gccgccctct cacccatgtc 
actgtcccag aggacaaagg ttctctgggc 
aggatggagg gtgcccgggg caagcaccag 



tggccacctg agggaagtat acactataat 60 
caagaaggca agtggattta ggtaccatat 120 
aacccacgat tgtgtaagac argtaacctg 180 
ccatacccag tcctccccac ggctcctcct 240 
gcccaaaagg gaacaaataa aagagccttc 300 
ctatgtcctc ttcaggctgt aggaggggaa 360 
tctctctctg atctaaagca aattaaggca 420 
atagatacgt agatggcctg ctgggtctgg 480 
tcatgttatt gcttgatcag acctaacctc 540 
ccgagagttt ggggatacct ggtacctcag 600 
gagcagtttc ctactggcca gcaagcagrc 660 
tcggatcatg gggactggag tcacaaacat 720 
agaactagga aaaagcccat gaactattca 780 
gaaaacccta ttgccttcct caaaaggctg 840 
tcaccagatt ccctcgaagg ccagtraatt 900 
gcagacatta ggaaaaagct ccaaaagtta 960 
attaaacctg gcaacctcag tgttctatca 1020 
aaagcaggat aagagaaagg ctgcagattr 1080 
caaagaggag aaaaaatgga gcaggccaat 1140 
tacaaggaca ctttaaacaa gattgtccaa 1200 
cactatgcca aggtgatcac tggaaggcac 1260 
cagaagtccc caaccagatg atccagcaac 1320 
ctcgtgttgt ca 1362 



<210> 14 
<211> 945 
<212> ADN 

<213> Homo sapiens 
<400> 14 

ttgcagatca atctcagact gctgtgctag 
ctctgagcca ggcatgggat ataatgtcct 
gcacagtatt agggtgggag tggcccgatt 
ggctaggaaa gagaattccc tgaccccttg 
gcttcagctc acactcaggt gactgcaccc 
cagtgagatg aacctggtac ctcagttgga 
tcacactggg agctgtagac tggagctgtt 
aatagactct ttggcagcag tgactctcca 
tgagaaagga ggactctgca ccttcttagg 
agggatggta cgagatgcca cccgatgttt 
cctttcaaac tcttatacca acctctggag 
tcccattgca gccatcttgc tattactcgc 
caaatttgtt tcctctagaa ttgaggccgt 
ccaaatgagc tcaactaaca acttctgcca 
cactggcctt aagagttccc ctctggaggg 
ctatccagca ggaagtagct agagcagtca 



caatgagtga ggcttcgtgg gcatgggacc 60 
tgtgtgccat ttgctaagac tgttggaata 120 
ttccaggtgc tgtctgtcac cgcttccctt 180 
ttcttcccag gtaaggcagt gcctcaccct 240 
actgtcctgc ccccactgtc ggacaagccc 300 
aatgcagaaa tcacctgtct tctgcgtcac 360 
cctatttggc catcttggaa ccatctccca 420 
aaaccaccaa ggcctagacc tcctcattgc 480 
ggaggagtgt tgtttttata ctgaccagtc 540 
acaggaaaag gcttctgaaa tcacacaaca 600 
ttgggcaaca tggcttctcc cctttctcgg 660 
cttcaggctg tgtattttta acctccttgt 720 
caagctacag atggtcttac aaatgggacc 780 
aggacccctg gaccaacctg ctggcccttt 840 
cactacaact gcagggcccc ttctttgccc 900 
tcacccaatt cccaa 945 
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<210> 15 
<211> 939 
<212> ADN 

<213> Homo sapiens 



<400> 15 

agagctacct 

cattttaaca 

catcgaccta 

gtcccaacag 

tctgtcagtg 

ctacaggaac 

atgatttctc 

tagactcctt 

agaaaggagg 

cagtatgaga 

caaactctat 

gacagccatc 

tgtttcctct 

gagctcaact 

cctgaagaat 

agcaggaagt 



tggcaagtac 
tacacaatca 
tatctgcctc 
taacattgcc 
cagagccata 
cagaatagct 
agacagtttg 
ggcagcagtg 
actctgcatt 
tgccactcgg 
accaaactct 
ttgctattat 
ggatcgaggc 
aacaacttct 
tcccctctgg 
agctagagct 



tctaggagta 
ggtctgccca 
cccactaact 
ccaggaaatc 
caactaatac 
agtttgttta 
caagaaataa 
accctccaaa 
ttcttagggg 
agtttacagg 
ggagttgggc 
ttgcctttga 
catcgagcta 
actgaggacc 
aggacactac 
gtcattgcct 



tgggaaaatg 
cccagcaagg 
agacagccac 
agaccatatc 
ccctacttat 
cttcattatc 
cgaaatctat 
acggctgagg 
aagagtgttt 
aaaaggcttc 
aacatggctt 
gccctgtatt 
cagatggtct 
cctggactaa 
aactgcaggg 
aatt cctaa 



aaaacaacaa 
tatattcttt 
ctgaatctta 
agtatccctc 
agggtaagga 
ctactaccac 
ccttactcta 
cctagacct c 
ttacactaac 
tgaagtcaga 
ctcccctttc 
tttaatctcc 
tcacaaatgg 
cctgctgacc 
ctccttcttt 



act cacacac 
gtatgtggaa 
gtctttctaa 
aaagctcaag 
atggctacng 
acactctcaa 
caatcccaaa 
ctcactgcca 
cagtcaggga 
caatgccttt 
taggtcccg" 
ttttcaaatt 
aaccccaaar 
ctttcactcg 
gcccctatcc 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

939 



<210> 16 
<211> 979 
<212> ADN 

<213> Homo sapiens 
<400> 16 

agtgataatg gaatacttga 
cagaactaat agccctcact 
atacagactc taagtgtgct 
gggaattcct aacttccgag 
tattggctgt acagaaacct 
gaaaggaaag ggaaatacaa 
ggctggaccc tccattagaa 
gggaagccaa gccccagtac 
cttccctccc ctccagatgg 
accaatagaa attacttaaa 
atgagatggc caaattatta 
tcagggcctg taaagtctgc 
tccctgtatc tttaacctcc 
acaaatagtt cttcaaatgg 
cctggaccag cctgctagcc 
aggaaatctc aactgcacaa 
gtcatcagcc aacctcccc 



aagtaatccc ctcactcccc 
cgggtactag aatcaggaga 
tacctagtcc tccatgccca 
ggaacaccta tcaaacatca 
aaagaggtgg cagttttaca 
gggagccacc aagttgatat 
atgcttatag gaggacccct 
tcagcaggag aaatagaata 
ctagccacca ataaaggaaa 
acccttcatc aaaccttcca 
tttactggac caggcctttt 
caaagaaata atcccctgca 
ttcttaaatt tgtctcttcc 
agccacagat gcagtccatg 
catgctccaa tgttaatgac 
cccctactac gccccaattc 



aggaactagt gctcagctgg 60 
aggaaaaagg gtaaatatat 120 
tgcagcaata tggagagaaa 180 
ggaagccatt aggaaattat 240 
ctgccggggt catcagaaag 300 
tgaagtcaaa agagccacaa 360 
agtatggggt aatcccctcc 420 
gggaacttca tgaggacata 480 
aatacttttg cctgcagcta 540 
cttaggcatt gatagcaccc 600 
caaaactatc aagcagatag 660 
ctgcaggcca tacatttcaa 720 
agaatcaaag ctgtaaaatt 780 
actaagatcc accacagacc 840 
atcgaaggca ccccctcctg 900 
agcagaaagc agttagagtg 960 

979 



<210> 17 
<211> 1774 
<212> ADN 

<213> Homo sapiens 
<400> 17 

catgctggta aaggaccgct agaatccagc agccaggacc actttctttg tggtcaagaa 60 
aggtgggaaa acaggtgcag gactgctaca ctggtaagca taactaatcc gataagcaga 120 
ggtccatggg tggttacgca ccctggaaag gaataagcat taggactata gaggacactc 180 
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taggactaat 
gatgggaaat 
ccaatctgac 
gccacaatat 
caccatctta 
tgtacaaact 
ccctacagga 
aactaataag 
caatgaacca 
atttggccca 
agacctaggt 
acaatccttt 
aaatgaaaaa 
tcaggtcaat 
agttcccagt 
acatttgcta 
ttcaatgatg 
actaagggaa 
aatcttaaag 
gtatgcctta 
ttataataga 
aggtgactgc 
aaagctgagc 
ttaaaaaaga 
ggaatcactg 
accagataat 
ccctcacaga 



gctcatcgga 
gttcccccca 
catcagacac 
cttcttcaag 
cagctagacc 
ttcttttcat 
agccctcaga 
gacccccctt 
aagagtgcca 
gccagcgtgc 
aaattctcag 
gatctgacat 
agtgctgcca 
gataggatga 
gtagaccctc 
acttgcgtgc 
tcccctataa 
ggattgagga 
gataagttta 
ggcccagagc 
gatcaggaag 
tttagtcgtg 
aaattgaatg 
ttgtccaagt 
gaaggcccac 
ccagcagcag 
gccttgggta 



aaatgactag 
aggcagaaat 
taagaaagaa 
gggcagaaac 
tcttttgtag 
taagagataa 
gtctacctcc 
caacccaaat 
atattacacg 
atgtaccttt 
ataaccctga 
ggagagatat 
taacagcagc 
caacagatga 
attaggacac 
tagaaggact 
cacagggaaa 
agcatacctc 
tcactcagtc 
aaaacttaga 
agcaggggaa 
gccctcaggc 
cctaacaggg 
agaaacaagc 
tgccccagga 
gactgaggat 
tgcttgacca 



gggtactggc 
gcccctaaga 
atgacttata 
ctggcct cct 
aaaagaaggc 
ctcccaatta 
cgaccccagc 
ggtccaaaag 
attatactcg 
ttctctctca 
tggctatatt 
aatgttactg 
ctgagagttt 
aagagaatga 
agaatcagaa 
aaggaaaact 
ggaagaaaat 
cctgtcacct 
agctgcagag 
aaccctactg 
tgggacaaat 
aaatggactt 
cttgcttcta 
tgcccccttg 
gatgaaggtc 
gcccagggca 
ttga 



atcccratgt 
tgtattctgg 
ttcttctgca 
gagggaagr a 
aaatggagtg 
tgtaaaaagt 
aagaccccaa 
gagatagaca 
ctccaagcag 
gatttaaagc 
gatgttttac 
ctaaatcaga 
ggcgaactct 
tt ccccacag 
cttggagatr 
aggaagaagc 
cctactgcc" 
gactctatta 
attaagaaaa 
aacttggcaa 
gggataaaaa 
tggaggct cc 
gtgtggtcta 
tccatgcccc 
ctctgagtca 
agcgccagcc 



tcttttttca 
agaaatggga 
gtaccacctg 
taaattataa 
aagtgccata 
gtgatttatg 
ctccttctcc 
aaggggtaaa 
tgggaggaga 
aaattaaaat 
aagggttagg 
cactaacccc 
ggtatctcag 
gccagcaggc 
ggtgccacag 
ccatgaatta 
ttctggagag 
aaggccaact 
aacttcaaaa 
cctcagtttt 
aaaaaaaaaa 
agaaaaggga 
caaggacact 
ttatgtcaag 
gaagccacta 
catgccatca 



240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1774 



<210> 18 
<211> 938 
<212> ADN 

<213> Homo sapiens 



<400> 18 

tgtaggaaga 

aaaagacaca 

tgcctaataa 

acttacagaa 

gttttattag 

tgccaaaagt 

tcagacagtt 

ttggtagcag 

gaactctgca 

tgagatactg 

tcttatacca 

gccatcttgc 

tcctctagga 

tcaactaaca 

aagagttccc 

ggaagtagct 



actcccttca 
gtattcagta 
ttggtctgct 
tcaggaagca 
tagcaaagaa 
taacagtgta 
tgcaagaaat 
tgactctcca 
ccttcttagg 
cctgacgttt 
acctctggag 
tattacttgc 
tcaaggccat 
acttctactg 
ttctggagga 
agatcagtca 



ggacaggaca 
agtgataagg 
caaatgtgtg 
gccatctata 
aaattaaaat 
acatgtatta 
aacgtaatct 
aaactgccga 
ggaagagtgc 
acaggaaaag 
ttgggcaaca 
cttcgggccc 
caagctacag 
aggacacctg 
cactacaact 
ttgcccaatt 



atagatggtt 
aaactcttgt 
agttgtttgc 
ccaattctaa 
cccaaactta 
tcctactatc 
atccttactc 
ggtctagacc 
tgtttttaca 
gcttctgaaa 
tggcttctcc 
tgtattttta 
atggtcttac 
gactgaccca 
gcagggcccc 
cccaacag 



cctcccaggt 
agaagcagag 
actcagccaa 
gttaatatgg 
caaggttttc 
acacactctc 
tacagtccca 
tcctcaatgc 
ctaaccagtc 
tcagacaacg 
ccttgctagg 
acctccttgt 
aaatggaacc 
ctggcccttt 
gtcttcaccc 



gattaaggaa 60 
ttagaaaaat 120 
atcttaaagt 180 
actaaacgag 240 
aactaaagtt 300 
aaaggatttc 360 
aatagactct 420 
tgagaaagga 480 
agggatagta 54 0 
cctttcaagc 600 
tcctgtggca 660 
caaatttgtt 720 
ccaaatgagc 780 
cactggccta 840 
ctatccagca 900 
938 



<210> 19 
<211> 1308 
<212> ADN 

<213> Homo sapiens 
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<400> 19 

gatgcttgcc 

ccaaagaacc 

catgggcaag 

ccacactggt 

ccaccaaggt 

ttttcctttt 

aacaatggct 

ctgcagctga 

gtgacagggg 

tttcttcctt 

ttctccgtag 

ctgagtctag 

tgtccctttc 

attctcaggc 

gcatgacatc 

ggagaagggg 

cataagcaat 

tgggtggggg 

ggatatgggg 

tgtggatttt 

ttccctctta 

tggccatttc 



ccaggcaccc 
tttgtcctct 
ggggcagctt 
aacaagccct 
ttgtctgtct 
tggcctgttc 
ccagattttg 
ttgggtaata 
agtatatttc 
tccctgagtt 
tccttctaga 
acaccagtgg 
tttggctgtc 
tgcagctaaa 
tctccaagtg 
acatacacct 
agcctgggga 
agattagagg 
gtaagctgag 
ccttacaatg 
cagaaaaggt 
ttcccatcag 



tcagtcctgt 
gaggcagtgc 
gtttctcact 
accaggtgat 
gagggtcatg 
ctcttggtac 
ttcagggcac 
aacttatctt 
cttgaggcct 
ataaaagaca 
acacaggtca 
ggatccatac 
attctatcat 
gctgcattct 
aggtcaaagg 
gagttagcca 
tttttgtggt 
aggcttatca 
aggtcatctt 
aaaataaagc 
caagctgcag 
agagagaata 



tgttggatca 
accttccagt 
ggacaatctt 
tggcctgctc 
actaaggctg 
ctattataga 
agggctcatt 
ttaggatcaa 
cccatagccg 
tcattgaaca 
gcagatgttt 
tggggatggc 
ttacttgact 
tttcattaaa 
tttgccctag 
aattcccctc 
cctttggaga 
gtaataggaa 
gtgggatgta 
ttggacataa 
gatagtactg 
ctggggctgg 



tctggtcggg 
gattgcctca 
ttttaaggtg 
tattttctgt 
tggcctttct 
acact gaggt 
ttggagcttt 
ttgactctca 
ctctaggaag 
actcatggac 
acgactccag 
ctgctgactg 
aagataccaa 
ggccagggtt 
atccatagga 
cctctacagc 
tttctttgct 
ggggagctat 
aattgcaagc 
ggtatttcac 
taatttatac 
gccatagt 



ggcttctggc 
gcattgtgga 
tccttccaaa 
cctctctgaa 
ctgatcttgc 
tgccaggttt 
ctcctgatat 
agagagttgg 
gcagaaggat 
tttttcccaa 
tccccatgat 
gtagggaatt 
gtatctccaa 
tgatctaata 
catcagagaa 
ttgaagggga 
tgtttccttc 
agggaggcta 
tttgcatagt 
tccatttgcc 
ttccttcagg 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1308 



<210> 20 
<211> 711 
<212> ADN 

<213> Homo sapiens 



<400> 20 

actgagagac 

gaaggtgacc 

cagagagctc 

ctattgcctg 

ctggcaacag 

tttcactcta 

tgagcttttg 

cccatccctc 

gccgctccca 

gttctaattg 

ttctaataga 

ggccaagaac 



aggactagct 
acgtccacct 
actaaaatgc 
agagcacagc 
cagcccccct 
ttaaatcttg 
ctcaccgtcc 
tggatcctgc 
attgggctaa 
agctgaacac 
actataacac 
tccaggtcag 



ggatttccta 
ttaaacacgg 
taattaggca 
aggagggaca 
ttgggtccct 
caactgcact 
accactgctg 
agggtgtccg 
aggcttgcca 
tagtcactgg 
ttaccacatg 
agaatacgag 



ggccgactaa 
ggcttgcaac 
aagacaggag 
acaatcggga 
tccctttgta 
cttctggtcc 
tttgccacca 
ctgtgctcct 
ttgttcctgc 
gttccatggt 
gcccaagatt 
gcttgccacc 



gaatccctaa 
ttagctcaca 
gtaaagaaat 
tataaaccca 
tgggagctgt 
atgtttctta 
ccgcagacct 
gatccagcga 
acggctaagt 
tctcttctgt 
ccattccttg 
atcttggaag 



gcctagctgg 60 
cctgaccaat 120 
agccaatcat 180 
ggcattcgag 240 
tttcatgcta 300 
cggctcgagc 360 
gccgctgact 420 
ggcgcccatt 480 
gcctgggttt 54 0 
gacccacggc 600 
gaatccgtga 660 
c 711 



<210> 21 
<211> 711 
<212> ADN 

<213> Homo sapiens 
<400> 21 

actgagagac aggactagct ggatttccta ggctgactaa gaatccctaa gcctagctgg 60 
gaaggtgacc acatccacct ttaaacacgg ggcttgcaac ttagctcaca cctgaccaat 120 
cagagagctc actaaaatgc taattaggca aagacaggag gtaaagaaat agccaatcat 180 
ctattgcctg agagcacagc aggagggaca atgatcggga tataaaccca agtcttcgag 240 
ccggcaacgg caaccccctt tgggtcccct ccctttgtat gggagctctg ttttcatgct 300 
atttcactct attaaatctt gcaactgcac tcttctggtc catgtttctt acggcttgag 360 
ctgagctttc gctcgccatc caccactgct gtttgccgcc accgcagacc cgccgctgac 4 20 
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tcccatccct 
tgccgctccc 
catcctaatt 
cttctaatag 
ggccaagaac 



ctggatcatg cagggtgtcc gctgtgctcc tgatccagcg aggcacccat 480 
aatcgggcta aaggcttgcc attgttcctg catggctaag tgcctgggtt 540 
gagctgaaca ctagtcactg ggttccatgg ttctcttctg tgacccacag 600 
agctataaca ctcaccgcat ggcccaaggt tccattcctt gaatccataa 660 



cccaggtcag agaacacgag gcttgccacc atcttgggag c 



711 



<210> 22 
<211> 2055 
<212> ADN 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (1) . . (2055) 



<400> 22 

ccc aag aca gcc aac tta gtt gca gac ate acc tec tta gec aaa tat 48 

Pro Lys Thr Ala Asn Leu Val Ala Asp lie Thr Ser Leu Ala Lys Tyr 
15 10 15 

caa caa gtt ctt aaa aca tta caa gga acc tat ccc tga gaa gag gga 96 

Gin Gin Val Leu Lys Thr Leu Gin Gly Thr Tyr Pro Glu Glu Gly 

20 25 30 

aaa gaa eta ttc cac cct tgt gac atg gta tta gtc aag tec ctt ccc 144 

Lys Glu Leu Phe His Pro Cys Asp Met Val Leu Val Lys Ser Leu Pro 
35 40 45 

tct aat tec cca tec eta gat aca tec tgg gaa gga ccc tac cca gtc 192 

Ser Asn Ser Pro Ser Leu Asp Thr Ser Trp Glu Gly Pro Tyr Pro Val 
50 55 60 

att tta tct acc cca act gcg gtt aaa gtg get gga gtg gag tct tgg 240 

lie Leu Ser Thr Pro Thr Ala Val Lys Val Ala Gly Val Glu Ser Trp 

65 70 75 80 

ata cat cac act tga gtc aaa tec tgg ata ctg cca aag gaa cct gaa 288 

lie His His Thr Val Lys Ser Trp lie Leu Pro Lys Glu Pro Glu 

85 90 95 

aat cca gga gac aac get age tat tec tgt gaa cct eta gag gat ttg 336 

Asn Pro Gly Asp Asn Aia Ser Tyr Ser Cys Glu Pro Leu Glu Asp Leu 
100 105 110 

cgc ctg etc ttc aaa caa caa cca gga gga aag taa eta aaa tea taa 384 
Arg Leu Leu Phe Lys Gin Gin Pro Gly Gly Lys Leu Lys Ser 
115 120 125 

ate ccc atg gcc etc cct tat cat att ttt etc ttt act gtt ctt tta 432 

lie Pro Met Ala Leu Pro Tyr His lie Phe Leu Phe Thr Val Leu Leu 
130 135 140 

ccc tct ttc act etc act gca ccc cct cca tgc cgc tgt atg acc agt 4 80 

Pro Ser Phe Thr Leu Thr Ala Pro Pro Pro Cys Arg Cys Met Thr Ser 

145 150 155 160 
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age tec cct tac caa gag ttt eta tgg aga atg cag cgt ccc gga aar 528 

Ser Ser Pro Tyr Gin Glu Phe Leu Trp Arg Met Gin Arg Pro Gly Asn 
165 170 175 

att gat gee cca teg tat agg agt ctt tct aag gga acc ccc acc ttc 576 

lie Asp Ala Pro Ser Tyr Arg Ser Leu Ser Lys Gly Thr Pro Thr Phe 

180 185 190 

act gee cac acc cat atg ccc cgc aac tgc tat cac tct gec act ctt 624 

Thr Ala His Thr His Met Pro Arg Asn Cys Tyr His Ser Ala Thr Leu 
195 200 205 

tgc atg cat gca aat act cat tat tgg aca gga aaa atg att aat cct 672 

Cys Met His Ala Asn Thr His Tyr Trp Thr Gly Lys Met lie Asn Pro 
210 215 220 

agt tgt cct gga gga ctt gga gtc act gtc tgt tgg act tac ttc acc 720 

Ser Cys Pro Gly Gly Leu Gly Val Thr Val Cys Trp Thr Tyr Phe Thr 
225 230 235 240 

caa act ggt atg tct gat ggg ggt gga gtt caa gat cag gca aga gaa 7 68 

Gin Thr Gly Met Ser Asp Gly Gly Gly Val Gin Asp Gin Ala Arg Glu 
245 250 255 

aaa cat gta aaa gaa gta ate tec caa etc acc egg gta cat ggc acc 816 

Lys His Val Lys Glu Val lie Ser Gin Leu Thr Arg Val His Gly Thr 

260 265 270 

tct age ccc tac aaa gga eta gat etc tea aaa eta cat gaa acc etc 864 

Ser Ser Pro Tyr Lys Gly Leu Asp Leu Ser Lys Leu His Glu Thr Leu 
275 " " 280 285 

cgt acc cat act cgc ctg gta age eta ttt aat acc acc etc act ggg 912 

Arg Thr His Thr Arg Leu Val Ser Leu Phe Asn Thr Thr Leu Thr Gly 
290 295 300 

etc cat gag gtc teg gee caa aac cct act aac tgt tgg ata tgc etc 960 

Leu His Glu Val Ser Ala Gin Asn Pro Thr Asn Cys Trp lie Cys Leu 
305 310 315 320 

ccc ctg aac ttc agg cca tat gtt tea ate cct gta cct gaa caa tgg 1008 

Pro Leu Asn Phe Arg Pro Tyr Val Ser lie Pro Val Pro Glu Gin Trp 
325 330 335 

aac aac ttc age aca gaa ata aac acc act tec gtt tta gta gga cct 1056 

Asn Asn Phe Ser Thr Glu lie Asn Thr Thr Ser Val Leu Val Gly Pro 

340 345 350 

ctt gtt tec aat ctg gaa ata acc cat acc tea aac etc acc tgt gta 1104 

Leu Val Ser Asn Leu Glu lie Thr His Thr Ser Asn Leu Thr Cys Val 
355 360 365 

aaa ttt age aat act aca tac aca acc aac tec caa tgc ate agg tgg 1152 

Lys Phe Ser Asn Thr Thr Tyr Thr Thr Asn Ser Gin Cys lie Arg Trp 
370 375 380 
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gta act cct ccc aca caa ata gtc tgc eta ccc tea gga ata ttt ttt 1200 

Val Thr Pro Pro Thr Gin lie Val Cys Leu Pro Ser Gly He Phe Phe 

385 390 395 400 

gtc tgt ggt acc tea gec tat cgt tgt ttg aat ggc tct tea gaa tct 1248 

Val Cys Gly Thr Ser Ala Tyr Arg Cys Leu Asn Gly Ser Ser Glu Ser 
405 410 415 

atg tgc ttc etc tea ttc tta gtg ccc cct atg acc ate tac act gaa 1296 

Met Cys Phe Leu Ser Phe Leu Val Pro Pro Met Thr He Tyr Thr Glu 
420 425 430 

caa gat tta tac agt tat gtc ata tct aag ccc cgc aac aaa aga gta 1344 

Gin Asp Leu Tyr Ser Tyr Val He Ser Lys Pro Arg Asn Lys Arg Val 
435 ' 4 40 4 45 

ccc att ctt cct ttt gtt ata gga gca gga gtg eta ggt gca eta ggt 1392 

Pro He Leu Pro Phe Val He Gly Ala Gly Val Leu Gly Ala Leu Gly 
450 455 460 

act ggc att ggc ggt ate aca acc tct act cag ttc tac tac aaa eta 1440 

Thr Gly He Gly Gly He Thr Thr Ser Thr Gin Phe Tyr Tyr Lys Leu 

465 " " 470 475 480 

tct caa gaa eta aat ggg gac atg gaa egg gtc gee gac tec ctg gtc 1488 

Ser Gin Glu Leu Asn Gly Asp Met Glu Arg Val Ala Asp Ser Leu Val 
485 "* 490 495 

acc ttg caa gat caa ctt aac tec eta gca gca gta gtc ctt caa aat 1536 

Thr Leu Gin Asp Gin Leu Asn Ser Leu Ala Ala Val Val Leu Gin Asn 
500 505 510 

cga aga get tta gac ttg eta acc get gaa aga ggg gga acc tgt tta 1584 

Arg Arg Ala Leu Asp Leu Leu Thr Ala Glu Arg Gly Gly Thr Cys Leu 
515 ' 520 525 

ttt tta ggg gaa gaa tgc tgt tat tat gtt aat caa tec gga ate gtc 1632 

Phe Leu Gly Glu Glu Cys Cys Tyr Tyr Val Asn Gin Ser Gly He Val 
530 535 540 

act gag aaa gtt aaa gaa att cga gat cga ata caa cgt aga gca gag 1680 

Thr Glu Lys Val Lys Glu He Arg Asp Arg He Gin Arg Arg Ala Glu 

545 550 555 560 

gag ctt cga aac act gga ccc tgg ggc etc etc age caa tgg atg ccc 1728 

Glu Leu Arg Asn Thr Gly Pro Trp Gly Leu Leu Ser Gin Trp Met Pro 
565 * 570 575 

tgg att etc ccc ttc tta gga cct eta gca get ata ata ttg eta etc 1776 

Trp He Leu Pro Phe Leu Gly Pro Leu Ala Ala He He Leu Leu Leu 
580 585 590 

etc ttt gga ccc tgt ate ttt aac etc ctt gtt aac ttt gtc tct tec 1824 

Leu Phe Gly Pro Cys He Phe Asn Leu Leu Val Asn Phe Val Ser Ser 
595 " 600 605 
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aga ate gaa get gta aaa eta caa atg gag ccc aag atg cag tec aag 1872 

Arg lie Glu Ala Val Lys Leu Gin Met Glu Pro Lys Met Gin Ser Lys 

610 615 620 

act aag ate tac cgc aga ccc ctg gac egg cct get age cca cga tct 1920 

Thr Lys lie Tyr Arg Arg Pro Leu Asp Arg Pro Ala Ser Pro Arg Ser 

625 630 635 640 

gat gtt aat gac ate aaa ggc ace cct cct gag gaa ate tea get gca 1968 

Asp Val Asn Asp He Lys Gly Thr Pro Pro Glu Glu He Ser Ala Ala 

645 650 655 

caa cct eta eta cgc ccc aat tea gca gga age agt tag age ggt cgt 2016 

Gin Pro Leu Leu Arg Pro Asn Ser Ala Gly Ser Ser Ser Gly Arg 

660 665 670 

egg cca ace tec cca aca gca ctt agg ttt tec tgt tga 2055 

Arg Pro Thr Ser Pro Thr Ala Leu Arg Phe Ser Cys 

675 680 685 



<210> 23 
<211> 28 
<212> PRT 

<213> Homo sapiens 
<400> 23 

Pro Lys Thr Ala Asn Leu Val Ala Asp He Thr Ser Leu Ala Lys Tyr 
1 ' 5 10 15 

Gin Gin Val Leu Lys Thr Leu Gin Gly Thr Tyr Pro 
20 25 



<210> 24 
<211> 55 
<212> PRT 

<213> Homo sapiens 
<400> 24 

Glu Glu Gly Lys Glu Leu Phe His Pro Cys Asp Met Val Leu Val Lys 
15 10 15 

Ser Leu Pro Ser Asn Ser Pro Ser Leu Asp Thr Ser Trp Glu Gly Pro 
20 25 30 

Tyr Pro Val He Leu Ser Thr Pro Thr Ala Val Lys Val Ala Gly Val 
35 40 45 

Glu Ser Trp He His His Thr 
50 55 



<210> 25 
<211> 38 
<212> PRT 
<213> Homo 



sapiens 
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<400> 25 

Val Lys Ser Trp lie Leu Pro Lys 
1 5 

Ala Ser Tyr Ser Cys Glu Pro Leu 
20 

Gin Gin Pro Gly Gly Lys 
35 



19 

Glu Pro Glu Asn Pro Gly Asp Asn 
10 15 

Glu Asp Leu Arg Leu Leu Phe Lys 
25 30 



<210> 26 
<211> 540 
<212> PRT 

<213> Homo sapiens 

<400> 26 

lie Pro Met Ala Leu Pro Tyr His lie Phe Leu Phe Thr Val Leu Leu 
15 10 15 

Pro Ser Phe Thr Leu Thr Ala Pro Pro Pro Cys Arg Cys Met Thr Ser 
20 25 30 

Ser Ser Pro Tyr Gin Glu Phe Leu Trp Arg Met Gin Arg Pro Gly Asn 
35 40 45 

lie Asp Ala Pro Ser Tyr Arg Ser Leu Ser Lys Gly Thr Pro Thr Phe 
50 " 55 60 

Thr Ala His Thr His Met Pro Arg Asn Cys Tyr His Ser Ala Thr Leu 
65 70 75 80 

Cys Met His Ala Asn Thr His Tyr Trp Thr Gly Lys Met lie Asn Pro 
8 5 " 90 95 

Ser Cys Pro Gly Gly Leu Gly Val Thr Val Cys Trp Thr Tyr Phe Thr 
100 * ~ 105 110 

Gin Thr Gly Met Ser Asp Gly Gly Gly Val Gin Asp Gin Ala Arg Glu 
115 120 125 

Lys His Val Lys Glu Val He Ser Gin Leu Thr Arg Val His Gly Thr 
130 135 140 

Ser Ser Pro Tyr Lys Gly Leu Asp Leu Ser Lys Leu His Glu Thr Leu 
145 ' J 150 ' 155 160 

Arg Thr His Thr Arg Leu Val Ser Leu Phe Asn Thr Thr Leu Thr Gly 
165 170 175 

Leu His Glu Val Ser Ala Gin Asn Pro Thr Asn Cys Trp He Cys Leu 
180 185 190 

Pro Leu Asn Phe Arg Pro Tyr Val Ser He Pro Val Pro Glu Gin Trp 

195 200 205 

Asn Asn Phe Ser Thr Glu He Asn Thr Thr Ser Val Leu Val Gly Pro 
210 215 220 
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Leu Val Ser Asn Leu Glu lie Thr His Thr Ser Asn Leu Thr Cys Val 
225 230 235 240 

Lys Phe Ser Asn Thr Thr Tyr Thr Thr Asn Ser Gin Cys lie Arg Trp 
245 250 255 

Val Thr Pro Pro Thr Gin lie Val Cys Leu Pro Ser Gly He Phe Phe 
260 265 270 

Val Cys Gly Thr Ser Ala Tyr Arg Cys Leu Asn Gly Ser Ser Glu Ser 
275 280 285 

Met Cys Phe Leu Ser Phe Leu Val Pro Pro Met Thr He Tyr Thr Glu 
290 295 300 

Gin Asp Leu Tyr Ser Tyr Val He Ser Lys Pro Arg Asn Lys Arg Val 
305 310 315 " 320 

Pro He Leu Pro Phe Val He Gly Ala Gly Val Leu Gly Ala Leu Gly 
325 330 335 

Thr Gly He Gly Gly He Thr Thr Ser Thr Gin Phe Tyr Tyr Lys Leu 
340 345 350 

Ser Gin Glu Leu Asn Gly Asp Met Glu Arg Val Ala Asp Ser Leu Val 
355 360 3 65 

Thr Leu Gin Asp Gin Leu Asn Ser Leu Ala Ala Val Val Leu Gin Asn 
370 375 380 

Arg Arg Ala Leu Asp Leu Leu Thr Ala Glu Arg Gly Gly Thr Cys Leu 
385 " 390 395 400 

Phe Leu Gly Glu Glu Cys Cys Tyr Tyr Val Asn Gin Ser Gly He Val 
405 410 415 

Thr Glu Lys Val Lys Glu He Arg Asp Arg He Gin Arg Arg Ala Glu 
420 425 430 

Glu Leu Arg Asn Thr Gly Pro Trp Gly Leu Leu Ser Gin Trp Met Pro 
435 440 445 

Trp He Leu Pro Phe Leu Gly Pro Leu Ala Ala He He Leu Leu Leu 
450 455 460 

Leu Phe Gly Pro Cys He Phe Asn Leu Leu Val Asn Phe Val Ser Ser 
465 470 475 480 

Arg He Glu Ala Val Lys Leu Gin Met Glu Pro Lys Met Gin Ser Lys 
485 490 495 

Thr Lys He Tyr Arg Arg Pro Leu Asp Arg Pro Ala Ser Pro Arg Ser 
500 " 505 510 



Asp Val Asn Asp He Lys Gly Thr Pro Pro Glu Glu He Ser Ala Ala 
515 ~ 520 525 
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Gin Pro Leu Leu Arg Pro Asn Ser Ala Gly Ser Ser 
530 535 540 



<210> 27 
<211> 15 
<212> PRT 

<213> Homo sapiens 
<400> 27 

Ser Gly Arg Arg Pro Thr Ser Pro Thr Ala Leu Arg Phe Ser Cys 
15 10 15 



<210> 28 
<211> 1080 
<212> ADN 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (1) . . (1080) 

<400> 28 

acc tct ttt gta gaa aag gca aat gga gtg aag tgc cat aag tac aaa 48 

Thr Ser Phe Val Glu Lys Ala Asn Gly Val Lys Cys His Lys Tyr Lys 
15 10 15 

ctt tct ttt cat taa gag aca act cac aat tat gta aaa agt gtg att 96 
Leu Ser Phe His Glu Thr Thr His Asn Tyr Val Lys Ser Val lie 

20 25 30 

tat gcc eta cag gaa gec ttc aga gtc tac etc cct ate cca gca tec 144 
Tyr Ala Leu Gin Glu Ala Phe Arg Val Tyr Leu Pro lie Pro Ala Ser 
35 40 45 

ccg act cct tec cca act aat aag gac ccc cct tea acc caa atg gtc 192 
Pro Thr Pro Ser Pro Thr Asn Lys Asp Pro Pro Ser Thr Gin Met Val 
50 55 60 

caa aag gag ata gac aaa agg gta aac agt gaa cca aag agt gcc aat 240 
Gin Lys Glu lie Asp Lys Arg Val Asn Ser Glu Pro Lys Ser Ala Asn 
65 70 75 80 

att ccc caa tta tga ccc etc caa gca gtg gga gga aga gaa ttc ggc 288 
lie Pro Gin Leu Pro Leu Gin Ala Val Gly Gly Arg Glu Phe Gly 

85 90 95 

cca gcc aga gtg cat gtg cct ttt tct etc cca gac tta aag caa ata 336 
Pro Ala Arg Val His Val Pro Phe Ser Leu Pro Asp Leu Lys Gin lie 
100 105 110 

aaa aca gac tta ggt aaa ttc tea gat aac cct gat ggc tat att gat 384 
Lys Thr Asp Leu Gly Lys Phe Ser Asp Asn Pro Asp Gly Tyr lie Asp 
115 ' '" 120 * 125 
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gtt tta caa ggg tta gga caa ttc ttt gat ctg aca tgg aga gat ata 432 
Val Leu Gin Gly Leu Gly Gin Phe Phe Asp Leu Thr Trp Arg Asp lie 

130 135 140 

atg tea ctg eta aat cag aca eta acc cca aat gag aga agt gec acc 480 

Met Ser Leu Leu Asn Gin Thr Leu Thr Pro Asn Glu Arg Ser Ala Thr 

145 150 155 160 

ata act gca gec tga gag ttt ggc gat etc tgg tat etc agt cag gtc 52S 

lie Thr Ala Ala Glu Phe Gly Asp Leu Trp Tyr Leu Ser Gin Val 
165 170 175 

aat gat agg atg aca aca gag gaa aga gaa tga ttc ccc aca ggc cag 576 

Asn Asp Arg Met Thr Thr Glu Glu Arg Glu Phe Pro Thr Gly Gin 

180 185 190 

cag gca gtt ccc agt eta gac cct cat tgg gac aca gaa tea gaa cat 624 

Gin Ala Val Pro Ser Leu Asp Pro His Trp Asp Thr Glu Ser Glu His 

195 200 205 

gga gat tgg tgc tgc aga cat ttg eta act tgt gtg eta gaa gga eta 672 

Gly Asp Trp Cys Cys Arg His Leu Leu Thr Cys Val Leu Glu Gly Leu 

210 215 220 

agg aaa act agg aag aag tct atg aat tac tea atg atg tec acc ata 720 

Arg Lys Thr Arg Lys Lys Ser Met Asn Tyr Ser Met Met Ser Thr lie 

225 230 235 240 

aca cag gga agg gaa gaa aat cct act gee ttt ctg gag aga eta agg 7 68 

Thr Gin Gly Arg Glu Glu Asn Pro Thr Ala Phe Leu Glu Arg Leu Arg 
245 250 255 

gag gca ttg agg aag cgt gec tct ctg tea cct gac tct tct gaa ggc 816 

Glu Ala Leu Arg Lys Arg Ala Ser Leu Ser Pro Asp Ser Ser Glu Gly 

260 265 270 

caa eta ate tta aag cgt aag ttt ate act cag tea get gca gac att 8 64 

Gin Leu lie Leu Lys Arg Lys Phe lie Thr Gin Ser Ala Ala Asp He 

275 280 285 

aga aaa aaa ctt caa aag tct gee gta ggc ccg gag caa aac tta gaa 912 

Arg Lys Lys Leu Gin Lys Ser Ala Val Gly Pro Glu Gin Asn Leu Glu 

290 295 300 

acc eta ttg aac ttg gca acc teg gtt ttt tat aat aga gat cag gag 960 

Thr Leu Leu Asn Leu Ala Thr Ser Val Phe Tyr Asn Arg Asp Gin Glu 

305 310 315 320 

gag cag gcg gaa cag gac aaa egg gat taa aaa aaa ggc cac cgc ttt 1008 

Glu Gin Ala Glu Gin Asp Lys Arg Asp Lys Lys Gly His Arg Phe 
325 330 335 

agt cat gac cct cag gca agt gga ctt tgg agg etc tgg aaa agg gaa 1056 

Ser His Asp Pro Gin Ala Ser Gly Leu Trp Arg Leu Trp Lys Arg Glu 

340 345 350 
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aag ctg ggc aaa ttg aat gcc taa 
Lys Leu Gly Lys Leu Asn Ala 

355 360 



1080 



<210> 29 
<211> 20 
<212> PRT 

<213> Homo sapiens 
<400> 29 

Thr Ser Phe Val Glu Lys Ala Asn Gly Val Lys Cys His Lys Tyr Lys 
15 10 15 

Leu Ser Phe His 

20 



<210> 30 
<211> 63 
<212> PRT 

<213> Homo sapiens 
<400> 30 

Glu Thr Thr His Asn Tyr Val Lys Ser Val He Tyr Ala Leu Gin Glu 
15 10 15 

Ala Phe Arg Val Tyr Leu Pro He Pro Ala Ser Pro Thr Pro Ser Pro 
20 25 30 

Thr Asn Lys Asp Pro Pro Ser Thr Gin Met Val Gin Lys Glu He Asp 
35 40 45 

Lys Arg Val Asn Ser Glu Pro Lys Ser Ala Asn He Pro Gin Leu 
50 55 60 



<210> 31 
<211> 79 
<212> PRT 

<213> Homo sapiens 
<400> 31 

Pro Leu Gin Ala Val Gly Gly Arg Glu Phe Gly Pro Ala Arg Val His 
15 10 15 

Val Pro Phe Ser Leu Pro Asp Leu Lys Gin He Lys Thr Asp Leu Gly 
20 25 30 

Lys Phe Ser Asp Asn Pro Asp Gly Tyr He Asp Val Leu Gin Gly Leu 
35 40 45 

Gly Gin Phe Phe Asp Leu Thr Trp Arg Asp He Met Ser Leu Leu Asn 
50 55 60 



Gin Thr Leu Thr Pro Asn Glu Arg Ser Ala Thr He Thr Ala Ala 
65 70 75 
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<210> 32 
<211> 21 
<212> PRT 

<213> Homo sapiens 
<400> 32 

Glu Phe Gly Asp Leu Trp Tyr Leu Ser Gin Val Asn Asp Arg Met Thr 
15 10 15 

Thr Glu Glu Arg Glu 
20 



<210> 33 
<211> 142 
<212> PRT 

<213> Homo sapiens 
<400> 33 

Phe Pro Thr Gly Gin Gin Ala Val Pro Ser Leu Asp Pro His Trp Asp 
1 5 10 15 

Thr Glu Ser Glu His Gly Asp Tro Cys Cys Arg His Leu Leu Thr Cys 
20 25 30 

Val Leu Glu Gly Leu Arg Lys Thr Arg Lys Lys Ser Met Asn Tyr Ser 
35 40 45 

Met Met Ser Thr lie Thr Gin Gly Arg Glu Glu Asn Pro Thr Ala Phe 
50 55 60 

Leu Glu Arg Leu Arg Glu Ala Leu Arg Lys Arg Ala Ser Leu Ser Pro 
65 70 75 80 

Asp Ser Ser Glu Gly Gin Leu lie Leu Lys Arg Lys Phe lie Thr Gin 
85 90 95 

Ser Ala Ala Asp lie Arg Lys Lys Leu Gin Lys Ser Ala Val Gly Pro 
100 " 105 110 

Glu Gin Asn Leu Glu Thr Leu Leu Asn Leu Ala Thr Ser Val Phe Tyr 
115 120 125 

Asn Arg Asp Gin Glu Glu Gin Ala Glu Gin Asp Lys Arg Asp 
130 ' 135 140 



<210> 34 
<211> 29 
<212> PRT 
<213> Homo 



sapiens 



<400> 34 

Lys Lys Gly His Arg Phe Ser His Asp Pro Gin Ala Ser Gly Leu Trp 
1*5 10 15 
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Arg Leu Trp Lys Arg Glu Lys Leu Gly Lys Leu Asn Ala 
20 ' 25 



<210> 35 
<211> 685 
<212> PRT 

<213> Homo sapiens 
<400> 35 

Pro Lys Thr Ala Asn Leu Val Ala Asp lie Thr Ser Leu Ala Lys Tyr 
15 10 15 

Gin Gin Val Leu Lys Thr Leu Gin Gly Thr Tyr Pro Xaa Glu Glu Gly 
20 25 30 

Lys Glu Leu Phe His Pro Cys Asp Met Val Leu Val Lys Ser Leu Pro 
35 40 45 

Ser Asn Ser Pro Ser Leu Asp Thr Ser Trp Glu Gly Pro Tyr Pro Val 
50 55 60 

lie Leu Ser Thr Pro Thr Ala Val Lys Val Ala Gly Val Glu Ser Trp 
65 70 75 80 

lie His His Thr Xaa Val Lys Ser Trp lie Leu Pro Lys Glu Pro Glu 
85 90 95 

Asn Pro Gly Asp Asn Ala Ser Tyr Ser Cys Glu Pro Leu Glu Asp Leu 
100 105 110 

Arg Leu Leu Phe Lys Gin Gin Pro Gly Gly Lys Xaa Leu Lys Ser Xaa 
115 120 125 

lie Pro Met Ala Leu Pro Tyr His lie Phe Leu Phe Thr Val Leu Leu 
130 135 140 

Pro Ser Phe Thr Leu Thr Ala Pro Pro Pro Cys Arg Cys Met Thr Ser 
145 150 155 160 

Ser Ser Pro Tyr Gin Glu Phe Leu Trp Arg Met Gin Arg Pro Gly Asn 
165 170 175 

lie Asp Ala Pro Ser Tyr Arg Ser Leu Ser Lys Gly Thr Pro Thr Phe 
180 185 190 

Thr Ala His Thr His Met Pro Arg Asn Cys Tyr His Ser Ala Thr Leu 
195 200 205 

Cys Met His Ala Asn Thr His Tyr Trp Thr Gly Lys Met lie Asn Pro 
210 215 220 

Ser Cys Pro Gly Gly Leu Gly Val Thr Val Cys Trp Thr Tyr Phe Thr 
225 ' ~ ~ 230 235 240 



Gin Thr Gly Met Ser Asp Gly Gly Gly Val Gin Asp Gin Ala Arg Glu 
245 250 255 



WO 99/67395 



PCT/FR99/01513 



26 



Lys His Val Lys Glu 
2 60 

Ser Ser Pro Tyr Lys 
275 

Arg Thr His Thr Arg 

2 90 

Leu His Glu Val Ser 
305 

Pro Leu Asn Phe Arg 
325 

Asn Asn Phe Ser Thr 
340 

Leu Val Ser Asn Leu 
355 

Lys Phe Ser Asn Thr 
370 

Val Thr Pro Pro Thr 
385 

Val Cys Gly Thr Ser 
405 

Met Cys Phe Leu Ser 
420 

Gin Asp Leu Tyr Ser 
435 

Pro lie Leu Pro Phe 
450 

Thr Gly He Gly Gly 
465 



Ser Gin Glu Leu Asn 
485 

Thr Leu Gin Asp Gin 
500 



Arg Arg Ala Leu Asp 
515 



Phe Leu Gly Glu Glu 

530 

Thr Glu Lys Val Lys 
545 



Val He Ser Gin Leu Thr 

265 

Gly Leu Asp Leu Ser Lys 
280 

Leu Val Ser Leu Phe Asn 
295 

Ala Gin Asn Pro Thr Asn 
310 315 

Pro Tyr Val Ser He Pro 
330 

Glu He Asn Thr Thr Ser 
345 

Glu He Thr His Thr Ser 
360 

Thr Tyr Thr Thr Asn Ser 
375 

Gin He Val Cys Leu Pro 
390 ~ 395 

Ala Tyr Arg Cys Leu Asn 
410 

Phe Leu Val Pro Pro Met 
425 

Tyr Val He Ser Lys Pro 
440 

Val He Gly Ala Gly Val 
455 

He Thr Thr Ser Thr Gin 
470 475 

Gly Asp Met Glu Arg Val 
490 

Leu Asn Ser Leu Ala Ala 
505 

Leu Leu Thr Ala Glu Arg 
520 

Cys Cys Tyr Tyr Val Asn 

535 

Glu He Arg Asp Arg He 
550 555 



Arg Val His Gly Thr 
270 

Leu His Glu Thr Leu 
285 



Thr Thr Leu Thr Gly 
300 



Cys Trp He Cys Leu 
32 0 

Val Pro Glu Gin Trp 
335 

Val Leu Val Gly Pro 
350 



Asn Leu Thr Cys Val 
365 

Gin Cys He Arg Trp 
380 

Ser Gly He Phe Phe 
400 

Gly Ser Ser Glu Ser 
415 

Thr He Tyr Thr Glu 
430 

Arg Asn Lys Arg Val 
445 

Leu Gly Ala Leu Gly 
460 

Phe Tyr Tyr Lys Leu 
480 

Ala Asp Ser Leu Val 
495 

Val Val Leu Gin Asn 
510 

Gly Gly Thr Cys Leu 
525 

Gin Ser Gly He Val 

540 

Gin Arg Arg Ala Glu 
560 
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Glu Leu 



Trp lie 



Arg Asn Thr 
565 

Leu Pro Phe 
580 



Gly Pro 
Leu Gly 



Trp Gly Leu 
570 

Pro Leu Ala 
585 



Leu Ser Gin 



Ala He He 



Trp Met Pro 
575 

Leu Leu Leu 
590 



Leu Phe 



Gly Pro Cys 
595 



He Phe 



Asn Leu Leu 
600 



Val Asn Phe 
605 



Val Ser Ser 



Arg He 
610 



Glu Ala Val 



Lys Leu 
615 



Gin Met Glu 



Pro Lys Met 
620 



Gin Ser Lys 



Thr Lys 
625 



He Tyr Arg 



Arg Pro 
630 



Leu Asp Arg 



Pro Ala Ser 
635 



Pro Arg Ser 
640 



Asp Val 



Asn Asp He 
645 



Lys Gly 



Thr Pro Pro 
650 



Glu Glu He 



Ser Ala Ala 
655 



Gin Pro 



Leu Leu Arg 
660 



Pro Asn 



Ser Ala Gly 
665 



Ser Ser Xaa 



Ser Gly Arg 
670 



Arg Pro 



Thr Ser Pro 
675 



Thr Ala 



Leu Arg Phe 
680 



Ser Cys Xaa 
685 



<210> 36 
<211> 360 
<212> PRT 

<213> Homo sapiens 
<400> 36 

Thr Ser Phe Val Glu 
1 5 



Leu Ser Phe His Xaa 
20 

Tyr Ala Leu Gin Glu 
35 

Pro Thr Pro Ser Pro 
50 

Gin Lys Glu He Asp 
65 

He Pro Gin Leu Xaa 
85 

Pro Ala Arg Val His 
100 



Lys Thr Asp Leu Gly 
115 

Val Leu Gin Gly Leu 
130 



Lys Ala Asn Gly Val 
10 



Glu Thr Thr His Asn 
25 



Ala Phe Arg Val Tyr 
40 

Thr Asn Lys Asp Pro 
55 

Lys Arg Val Asn Ser 
70 

Pro Leu Gin Ala Val 
90 



Val Pro Phe Ser Leu 
105 



Lys Phe Ser Asp Asn 
120 

Gly Gin Phe Phe Asp 
135 



Lys Cys His Lys Tyr Lys 
15 

Tyr Val Lys Ser Val He 
30 

Leu Pro He Pro Ala Ser 
45 

Pro Ser Thr Gin Met Val 
60 

Glu Pro Lys Ser Ala Asn 
75 80 

Gly Gly Arg Glu Phe Gly 
95 

Pro Asp Leu Lys Gin He 
110 

Pro Asp Gly Tyr He Asp 
125 

Leu Thr Trp Arg Asp He 
140 
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Met Ser Leu Leu Asn Gin Thr Leu Thr Pro Asn Glu Arg Ser Ala Thr 
145 150 155 160 

lie Thr Ala Ala Xaa Glu Phe Gly Asp Leu Trp Tyr Leu Ser Gin Val 
165 " 170 175 

Asn Asp Arg Met Thr Thr Glu Glu Arg Glu Xaa Phe Pro Thr Gly Gin 
180 185 190 

Gin Ala Val Pro Ser Leu Asp Pro His Trp Asp Thr Glu Ser Glu His 
195 200 205 

Gly Asp Trp Cys Cys Arg His Leu Leu Thr Cys Val Leu Glu Gly Leu 
210 215 220 

Arg Lys Thr Arg Lys Lys Ser Met Asn Tyr Ser Met Met Ser Thr lie 
225 " 230 235 240 

Thr Gin Gly Arg Glu Glu Asn Pro Thr Ala Phe Leu Glu Arg Leu Arg 
245 250 255 

Glu Ala Leu Arg Lys Arg Ala Ser Leu Ser Pro Asp Ser Ser Glu Gly 
260 ' 265 270 

Gin Leu lie Leu Lys Arg Lys Phe lie Thr Gin Ser Ala Ala Asp lie 
275 280 285 

Arg Lys Lys Leu Gin Lys Ser Ala Val Gly Pro Glu Gin Asn Leu Glu 
290 ^ 295 300 

Thr Leu Leu Asn Leu Ala Thr Ser Val Phe Tyr Asn Arg Asp Gin Glu 
305 310 315 320 

Glu Gin Ala Glu Gin Asp Lys Arg Asp Xaa Lys Lys Gly His Arg Phe 
325 ' 330 335 

Ser His Asp Pro Gin Ala Ser Gly Leu Trp Arg Leu Trp Lys Arg Glu 
340 345 350 



Lys Leu 



Gly Lys 
355 



Leu Asn Ala Xaa 
360 



<210> 37 

<211> 26 

<212> ADN 

<213> Homo sapiens 

<400> 37 

ggaccataga ggacactcca ggacta 26 



<210> 38 
<211> 25 
<212> ADN 

<213> Homo sapiens 
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<400> 38 

cctcagtcct gctgctggat catct 



25 



<210> 39 
<211> 27 
<212> ADN 

<213> Homo sapiens 
<400> 39 

cctccaagca gtgggaggaa gagaatt 27 



<210> 40 
<211> 28 
<212> ADN 

<213> Homo sapiens 



<210> 41 
<211> 30 
<212> ADN 

<213> Homo sapiens 
<400> 41 

ggaagaagtc tatgaattat tcaatgatgt 30 



<210> 42 
<211> 27 
<212> ADN 

<213> Homo sapiens 



<210> 43 
<211> 27 
<212> ADN 

<213> Homo sapiens 
<400> 43 

gccttcagaa gagtcaggtg acagaga 27 



<210> 44 
<211> 25 
<212> ADN 

<213> Homo sapiens 



<400> 40 

ccttccctgt gttattgtgg acatcatt 



28 



<400> 42 

gggacacaga atcagaacat ggagatt 



27 



<400> 44 

gagcctccaa agtccacttg cctga 



25 
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<210> 45 
<211> 29 
<212> ADN 

<213> Homo sapiens 
<400> 45 

gatttcagta tctactagtc tgggtagat 29 



<210> 46 
<211> 27 
<212> ADN 

<213> Homo sapiens 



<210> 47 
<211> 28 
<212> ADN 

<213> Homo sapiens 
<400> 47 

ccaagacagc caacttagtt gcagacat 28 



<210> 48 

<211> 28 

<212> ADN 

<213> Homo sapiens 



<210> 49 
<211> 29 
<212> ADN 

<213> Homo sapiens 
<400> 49 

gcaatactac atacacaacc aactcccaa 29 



<210> 50 
<211> 26 
<212> ADN 

<213> Homo sapiens 



<400> 46 

ctaggaaatc cagctagtcc tgtctca 



27 



<400> 48 

ggacgctgca ttctccatag aaactctt 



28 



<400> 50 

gggggaggca tatccaacag ttagta 



26 
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<210> 51 
<211> 30 
<212> ADN 

<213> Homo sapiens 
<400> 51 

ccatctacac tgaacaagat ttatacactt 30 



<210> 52 
<211> 28 
<212> ADN 

<213> Homo sapiens 



<210> 53 
<211> 31 
<212> ADN 

<213> Homo sapiens 
<400> 53 

cgaatacaac gtagagcaga ggagcttcga a 31 

<210> 54 
<211> 28 
<212> ADN 

<213> Homo sapiens 



<210> 55 
<211> 27 
<212> ADN 

<213> Homo sapiens 
<400> 55 

gcgtagtaga ggttgtgcag ctgagat 27 



<210> 56 
<211> 27 
<212> ADN 

<213> Homo sapiens 



<400> 52 

aatgccagta cctagtgcac ctagcact 



28 



<400> 54 

agcccaagat gcagtccaag actaagat 



28 



<400> 56 

cccttaccaa gagtttctat ggagaat 



27 



<210> 57 
<211> 27 
<212> ADN 



<213> Homo sapiens 
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<400> 57 

accgctctaa ctgcttcctg ctgaatt 27 

<210> 58 
<211> 420 
<212> PRT 

<213> Homo sapiens 
<400> 58 

Thr Ser Phe Val Glu Lys Ala Asn Gly Val Lys Cys His Lys Tyr Lys 
15 10 15 

Leu Ser Phe His Xaa Glu Thr Thr His Asn Tyr Val Lys Ser Val lie 
20 25 30 



Tyr Ala Leu Gin Glu Ala Phe Arg Val Tyr Leu Pro Ile\LeufPro Ala 

35 4 0 4 5 

Ser Pro Thr Pro Ser Pro Thr Asn Lys Asp Pro Pro Ser Thr Gin Met 

50 55 60 

Val Gin Lys Glu lie Asp Lys Arg Val Asn Ser Glu Pro Lys Ser Ala 

65 70 * 75 80 

Asn lie Pro Gin Leu Xaa Pro Leu Gin Ala Val Gly Gly Arg Glu Phe 

85 90 95 

Gly Pro Ala Arg Val His Val Pro Phe Ser Leu Pro Asp Leu Lys Gin 

100 105 110 

lie Lys Thr Asp Leu Gly Lys Phe Ser Asp Asn Pro Asp Gly Tyr lie 

115 120 125 

Asp Val Leu Gin Gly Leu Gly Gin Phe Phe Asp Leu Thr Trp Arg Asp 

130 " 135 140 

lie Met Ser Leu Leu Asn Gin Thr Leu Thr Pro Asn Glu Arg Ser Ala 

145 150 155 160 

Thr lie Thr Ala Ala Xaa Glu Phe Gly Asp Leu Trp Tyr Leu Ser Gin 

165 170 175 

Val Asn Asp Arg Met Thr Thr Glu Glu Arg Glu Xaa Phe Pro Thr Gly 

180 185 190 

Gin Gin Ala Val Pro Ser Leu Asp Pro His Trp Asp Thr Glu Ser Glu 

195 200 205 

His Gly Asp Trp Cys Cys Arg His Leu Leu Thr Cys Val Leu Glu Gly 

210 215 220 

Leu Arg Lys Thr Arg Lys Lys Ser Met Asn Tyr Ser Met Met Ser Thr 

225 ~* 230 ' 235 240 

lie Thr Gin Gly Arg Glu Glu Asn Pro Thr Ala Phe Leu Glu Arg Leu 

245 250 255 
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Arg Glu Ala Leu Arg Lys Arg Ala Ser Leu Ser Pro Asp Ser Ser Glu 

2 60 ~ 2 65 270 

Gly Gin Leu lie Leu Lys Arg Lys Phe lie Thr Gin Ser Ala Ala Asp 
275 280 285 

lie Arg Lys Lys Leu Gin Lys Ser Ala Val Gly Pro Glu Gin Asn Leu 
290 295 300 

Glu Thr Leu Leu Asn Leu Ala Thr Ser Val Phe Tyr Asn Arg Asp Gin 
305 310 315 320 

Glu Glu Gin Ala Glu Gin Asp Lys Arg Asp Xaa Lys Lys Gly His Arg 
325 330 335 

Phe Ser His Asp Pro Gin Ala Ser Gly Leu Trp Arg Leu Trp Lvs Arg 
340 345 350 

Glu Lys Leu Gly Lys Leu Asn Ala Xaa Xaa Gly Leu Leu Pro Val Arg 
355 ~ " 360 365 

Ser Thr Arg Thr Leu Xaa Lys Arg Leu Ser Lys Xaa Lys Xaa Ala Ala 
370 375 380 

Pro Ser Ser Met Pro Leu lie Ser Arg Glu Ser Leu Glu Gly Pro Leu 
385 390 395 400 

Pro Gin Gly Thr Lys Val Leu Xaa Val Arg Ser His Xaa Pro Asp Ser 
405 410 415 

Ser Ser Arg Thr 
420 



<210> 59 
<211> 32 
<212> ADN 

<213> Homo sapiens 
<400> 59 

taaactacaa atggttcttc aaatggagcc ca 32 

<210> 60 

<211> 32 

<212> ADN 

<213> Homo sapiens 

<400> 60 

gatgcagtcc aagatgcagt ccatgactaa ga 32 

<210> 61 
<211> 1740 
<212> ADN 

<213> Homo sapiens 
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<400> 61 

aggttggctg 

gcagttgaga 

gcaggccagt 

tgaagaacca 

ttaaagatac 

tgcaagtggg 

gccacattct 

ggggtgcagt 

gggccaagag 

gcagatcctc 

ttggcagtat 

aactgcggtt 

tggggaatta 

ttccctcctc 

aggaggtgat 

ggaagggctg 

ggattcttag 

gcttttttag 

gcctccaggc 

ctgcagcctt 

gaattatttc 

aggcctccac 

gggcatgtgg 

tcctgaagga 

gactatctgc 

atgggtgctg 

gttagctgca 

atgtcctcgt 

gaggggatta 



acaaccgctc 
tttccttggg 
ccaggggtcc 
tttgtagttt 
aaggattgaa 
gtttccttta 
ccatagaagc 
gagagtgaaa 
gatctacgai; 
tagaggttca 
ccagggtttg 
agggtagata 
aaggggaagg 
tcagggacag 
gtctgcaact 
tccatacagc 
taaggctata 
atgtcgtttg 
acagtgtaag 
gaaattgggg 
atgaattagt 
ccaaccagtg 
gtaaaatcta 
gcttggcaat 
ttgacagttt 
tcaatgccta 
ggcaaaagta 
gagtttcccc 
ccccatacta 



ttaactgctt 
aggggtgcct 
gcggtagatc 
tacagcttcg 
atgtacggcc 
gaaaaactcc 
tctcggtaag 
gggggtaaga 
tctagttact 
caggaatagc 
gctcgagtgt 
aaatgactgg 
gacttgacta 
gttccctgta 
aagttggccg 
atctcatatg 
ggcaacagag 
agtgtttcat 
tgatattgta 
ccattgtcac 
acttttatta 
aaagtaccca 
gttgctagtc 
aaggcagggg 
tgaaaaggcc 
agtgaaaggt 
ttttttcttt 
attccatttc 
ggggtccttc 



catgctgaat 
tcaatgtcat 
ttagtcatgg 
attctggaag 
tgaagtgcag 
gatacaatag 
gggagctact 
gaacagtaaa 
ttcctcacgg 
tagcattgtc 
gacttatcca 
gtagggtcct 
ataccatgtc 
atgttttaag 
tctctcagtc 
gactaagtcc 
caggccatgc 
tcattttctc 
tacctaacgc 
tctgtaaacc 
cctcttgggc 
gattagtaga 
ttctcctggg 
attatttctt 
tggtccagta 
ctggtgaagg 
ggtggctggc 
ttctgctgag 
tgtaagcatt 



tggggcatag 
caacattgga 
actgcatctg 
agacaaacgt 
gggcatatga 
ggcatcaata 
ggtagtacag 
aagaaaaata 
ttgtcgcctg 
tgctggattt 
agactccact 
tcccaggatg 
accagggtgg 
aactcgttga 
aagcacaagg 
tgctttttgg 
aaggtgggtt 
aacttttcct 
ctgggatact 
tcagggaagt 
cttttctgtc 
tactgaaatc 
taatggcctg 
tggcacactt 
aataatgatt 
gttttaagta 
catcctgagg 
tactggagct 
tctaatggag 



taggggtcgt 
gcatgggcta 
gggctccatt 
aacaaggagg 
gtgtgggcgg 
tttctaggaa 
cagcatacag 
tgacaaggga 
aagagcaggc 
tcgggttcct 
ccagccactt 
tgtgtaggga 
aataattcct 
tatttggcta 
tcattggtta 
ggacagtttc 
tcttgggtta 
gaggatcgtg 
ccctgcgtta 
ccgaatctgg 
ctacaaggga 
tctgagattt 
ttctttgttc 
cacaggccct 
tggccatctg 
atttccattg 
agaggaaact 
tggtttccca 
agtcctgcct 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 



<210> 62 
<211> 7140 
<212> ADN 

<213> Homo sapiens 



<400> 62 

ttggtcttaa 

tctcacgctg 

ccctgtgacc 

gtgaaaatgg 

cccatcttaa 

actgagcacc 

ttccactacc 

tttttcggac 

gcctgtttgg 

taggaggact 

acctacaacc 

aggtaagcag 

ctcactaccc 

acaaaggaga 

agacagtctt 

ctccattggt 

ggtggtacgt 

tctgtgtctc 

ccattccccc 



gaacacaaat 
atttagataa 
tgcacgtata 
cctgttcctg 
ctgagcgatt 
ttgtgacccc 
cacccaaatc 
tcagcccgcc 
tggactctct 
ccttcaggag 
ttgggtcctc 
tcttttcact 
ttcaatctcc 
cacattttat 
cccttggtgt 
gtctgatcac 
caactgcaaa 
tacctttctc 
ttcttctccc 



gatatggctc 
aacgactgtc 
catccagatg 
ccttaactga 
aaccttgtga 
cgcccctgcc 
ctataaaatg 
tgcacccagg 
tcacacggac 
accagtcccc 
agaccaacca 
ctcttctcca 
ctgtccttcc 
ccatggaccc 
ttaatcactg 
ggtggggaca 
agcaggggac 
tttaaactta 
ttagcctgtg 



caatgactgg 
aggcctctga 
gcctgaagta 
tgacattcca 
aattccttct 
cctaagagaa 
gccccacccc 
tgaaataaac 
gctcatgaca 
tgtccttgcc 
gcccaaggaa 
gcctctcttg 
aattccagtt 
aaaactccag 
cggggacgcc 
cctgccttgg 
gcctgctttg 
cctccttcac 
ttcttaaaaa 



aggaacacca 
gcccaagcta 
accaaagaat 
ccattgtgat 
cctggctcaa 
aacccccttt 
tatctccctt 
agccttgttg 
tttggtgcca 
ctcactctgt 
cagctcacca 
ctacccttca 
ctttttcatc 
caccagtcac 
tgcctgatta 
tcactcaccc 
gctgctcacc 
tatgggcaaa 
cctaaaacct 



gggtccttgg 
agccatcctc 
cacaaaagca 
ttgttcctgc 
aacctccccc 
gattataatt 
cgctgactcc 
ctcacacaaa 
aaacctggga 
gaggacatcc 
atttcaaatc 
aactccctct 
tctagtagag 
ggacttggga 
ttcacccaca 
acattccctt 
cacccccttc 
cttctgccct 
cttcaactca 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 
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cacctgacct aaaacctaaa tgccttattt tcttctgcaa cactgcgtgg ctgcagtaca 1200 
aacttgataa tagctttaaa tggccagaat atggcacttt caatttctcc atcctacaag 1260 
atctagataa tttttgtgga aaaatggaaa aatggtctga gatgcctgac gtccaggcat 1320 
tcttttacac attggtccct ccctagtctc tgctcccaat gcgactcatc ccaaatcttr 1380 
cttctttctc tcctgtctgt tccttcagtc tccaccccaa gctctgagtc ctttgaatcc 1440 
tcctttgcta cagacccatc tgaactctcc cctcctcccc aggctgctcc tcaccaggcc 1500 
gagccaggtc ccaattcttc ctcagcctct gctcccccac cctataatcc ttttatcacc 1560 
tcctctcctc acactcagtc cggcttacag tttcgttctg tgactagccc tcccccatct 1620 
gcccaacaat ttcctcttaa agaggtggct ggagctaaag gcatagtcaa ggttaatgct 1680 
cctttttctt tatctgacct ctcccaaatc agttagcgtt tacgctcttt ttcatcaaat 1740 
ataaaaaccc agccagttca tggcccatct ggcaacaacc cttacaggct ttacagccct 1800 
agaccctgaa gggtcagaag gccgtcttat tctcaatatg cattttatta cccaatccgc 1860 
tcccaacatt aaataaagct ccaaaaatta aattctggcc ctcaaacccc acaacaggac 1920 
ttaattaacc tcacttcaag gtgtacaaga atagagtaga ggcagccaag tagcaacgta 1980 
tttgagttgc aattccttgc ctcaactctg agagaaaccc cagccacatc tccagcaaac 2040 
aagaacttca aaacacctga actgcagcag ccaggcgttc ctccaggacc acctccccca 2100 
ggatcttgct tcaagtgccg gaaatctgac cattgggcca aggaatgcct gcagcccagg 2160 
attcctccta agccacgtcc catttgtgca ggaccccact ggaaatcgga ctgtccaact 2220 
cacccggcag ccaatcccag agcccctgga actctggccc aaggctctct gactgactcc 2280 
ttcccagatc ttctcggctt agcagctgaa gactgacact gcccgatcac ttcagaagtc 2340 
ccctggacca tcacggatac tgagcttcag gtaactctca cagtggaggc taagtccatc 2400 
ccctgtttaa tcgatacagg ggctacccac tccacatcac cttcttttca agggcctgtt 2460 
tccctttccc ccataactgt tgtgggtatt gacggccaag cttcaaaacc ccttaaaact 2520 
cccccactct ggtgccaact tggacaacat tcttttatgc actctttttc agttatcctc 2580 
acctgcccag ttcccttatt aggccgagac attttaacca aattatctgc ttccccgact 2640 
attcctgggc tacagccaca tctccttgcc gcccttcttc ccaacccaaa gcctccttca 2700 
tatcttcctc tcatatcccc ccaccttaac ccacaagtat gggacacctc tactccctcc 2760 
ctggcaaccg atcacacgcc cattactatc ccattaaaac ctaatcaccc ttaccctgct 2820 
caatgccagt atcccatacc acaacaggct ttaaagggat tgaagcctgt tatcacttgc 2880 
ctgctacagc acgggcttct aaaacctata aactctccat acaattcccc cattttacct 2940 
gtctaaaaac cagataagtc ttacaggtta gttcagaatc tgcaccttat caaccaaatt 3000 
gttttgccta tccaccctgt agcacccaac tcgtacactc ttttgtcctc aatgccttcc 3060 
cccacaactc actattccgt tcttgatctt aaagatgctt ttttcactat tcccctgcac 3120 
ccctcatccc agcctctctt tgcttttacc tggactgacc ctgacaccca tcagtcccag 3180 
cagcttacct gggctgtact gccgcaaggc ttcagggaca gccctcatta cttcagccaa 3240 
gctctttctc atgatttact ttctttccac ctctctgctt ctcaccttat tcaatatatt 3300 
gatgaccttc tactttgtag cccctccttt aaatcttctc aacaagacac cctcctgctc 3360 
cttcaacatt tgttctccaa aggatatcgg gtatccccct ccaaagctca aatttcttct 3420 
ccatctgtta catacctcgg cataattctt catgaaaaca catgtgctct ccctgccaat 3480 
tgcgtctcca actgatctct caaatcccaa cctcttctac aaaacaacaa ctcctttccc 3540 
tcctaggcat ggttggatac ttttgccttt ggatacctgg ttttgccatc ctaacaaaat 3600 
cattatataa actcacaaaa ggaaacctag ctgaccccat agattctaaa tcctttcccc 3660 
actcctcttt ccattccttg aagacagctt tagagactgc tcccacacta gctctccctg 3720 
tctcatccca acccttttca ttacacacag ccgaagtgca gggctgtgca gtcggaattc 3780 
ttacacaagg accgggacca tgccctgtag cctttttgtc caaacaactt gaccttactg 38 4 0 
ttttaggctc gccatcatgt ctccatgcgg tagcttccgc tgccctaata cttttagagg 3900 
ccctcaaaat cacaaactat gctcaactca ctctctacag ctctcacaac ttccaaaatc 3960 
tattttcttt ctcacacctg acgcatatac tttctgctcc ccggctcctt cagctgtatt 4020 
cactctttgt tgagtctccc acaattacca ttcttcctgg cccagacttc aatctggcct 4080 
cccacattat tctggatacc acacctgacc ctgatgattg tatgtctctg atctacctga 4140 
cattcacccc atttccccat atttccttct tttctgttcc tcatgttgat cacatttggt 4200 
ttactgacgg cagttccacc aggcctgatc gccactcacc agcaaaggca ggctatgcta 4260 
tagaatcttc cacatccatc attgaggcta ctgctctgcc cccctccact acctctcagc 4320 
aagccgaact gattgcctta actcgggcct tcactcttgc aaagggacta cacgtcaata 4380 
tttatactga ctctaaatat gccttccata tcttgcacca ccatgctgtt atatgggctg 4440 
aaagaggttt cctcactacg caagggtcct ccatcattaa tgcctcttta ataaaaactc 4500 
ttctcaaggc tgctttactt ccaaaggaag ctggagtcac acactgcaag ggccaccaaa 4560 
aggcgtcaga tcccattact ctaggaaatg cttatgctga taaggtagct aaagaagcac 4 620 
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ctagcgttcc aacttctgtc cctcatggcc 
cctactcccc cattgaaact tccgcctatc 
tagaccaagg aaaatatctc cttccagcct 
ataacctctt ccatgtaggt tacaagccac 
tccatcgtgg aaacatatcc tcaaggaaat 
tacccctcag ggattgttca ggccccctcc 
ccctgcccag gactggcaaa ttgactttac 
cctcttggtc tgggtagaca ctgtcactgg 
gaaggccact gcagtcattt cttcccttct 
cacctctata cagtccaata acggagcagc 
tcaggctctt ggtattcagt ggaaccttcg 
ggtagaatgg actaatggtc ttttaaaaac 
aaaggaggat agagcccaaa aactcgcaac 
gcactctcta attggatgtc ttaggtcctc 
ctccttctct tattcggacc ttgtgtcttc 
atccaggcca tcaccaatcg ttctatacaa 
cgccccttac cacaaaatct tccttcagct 
cccataatcc ctctcgaagc agccctgaga 
ccaaaatttt tgctgcccca acacttcaac 
aagaagacag caatgtcagg cctctgagcc 
tatacatcca gatggcctga agtaactgaa 
cctgccttaa ccgatgacat tccaccactg 
aattaacctt gggaaattcc ttctcctggc 
cccctgcccc tccactaccc acccaaatcc 
ctgactcctt ttttggactc agcccgcctg 
cacacaaagc ctgtttggtg gactctcttc 
cacatggagt ggttttaagg agcagagagt 
cctgtacaga cacagaggga gggggctcca 
gaaaagtggt tgattatact gggaggctgg 
aggggattgg gttgaccagg tgtatcattc 
cctcagccct ttaatatgca aatgtgggtt 
ctggaggggg ccatgacact tggtacatgt 
gtggccatgt tgggtggacc tagtttttaa 
gcctggctct ttaagctgtc ttttctgtta 
tgcttcttat tacaagaaaa tttccaaaaa 
tttcttaata acttatgtat taccataatt 
ccactgcaat taacatgctg gctttactgc 
tcatattgca actgcctgac ctctgccacc 
gcccatttcg attgtaacat ctgccactta 
aattcattca acatccattc caacaccacc 
gaattactga gtcacatgat cttcactgca 
acagtgaaca tagacagaag tccctggggc 



36 

agtttttctc cttcccatca gtcattccca 4680 
aatctcttct cacacaaggc aaatggttct 4740 
cacaggccca ttctattctg tcatcatttc 4800 
tagtccacct cttagaacct ctcattrcct 4860 
cacttctcag tgttccatct gctattctac 4920 
cctccctaca catcaagctc ggggatttgc 4980 
tcacatgccc tgagtcagga aactaaaata 5040 
atgggtagag gcctttccca cagggtctga 5100 
gtcagacata attccttggg ttggccttcc 5160 
ctttattagt caaatcacct gagcagtttt 5220 
taccccttac tgtcctcaat cttcaggaaa 5280 
acaccccacc aaactcagcc tccaacttaa 5340 
caagctagta attatgctga acccccttgg 5400 
ccaaatctta gtcctttaat atctgttttt 5460 
cgtttagttt ttcaattcat acaaaaccgc 5520 
taaatgctcc ttctaacaac cccacaatat 5580 
taatctctcc cactctaggt tcccatgccg 5640 
aacatagccc attatctctc cataccaccc 5700 
actattttac attatttttc ttattaatat 5760 
caagccatca tatcccctgt gacctgcaca 5820 
gaatcacaaa agaagtgaaa atggcctgtt 5880 
tgatttgttc ctgccccacc ttaactgagc 5940 
tcaaaacctc ccccactgag caccttgtga 6000 
tataaaatgg ccccacccca tctcccttag 6060 
cacccaggtg aaataaacag ccttgttgct 6120 
acagggacgg gggtgacaac aacacggaca 6180 
ttaatacgca aaaaagaagg aagaggctcc 6240 
agccgagaga aggaaacccc atgtgcagtg 6300 
aggaggcggt gtctgatttg cacagggccc 6360 
atgtaccccg caaaaaacct ggccctccca 6420 
gccatgatgt tctgaaaaca catgaattat 6480 
gctgacaaga agagggtggg aatcgccatg 6540 
tagcctgcat ttgcatatca aagtttgctg 6600 
gaaaaggaat ggtttggaat gggtgagggt 6660 
cctttactct ttctagctgc caaaaaacta 6720 
aggcagcacc aaagatccct gcaggtcaga 6780 
tgattatggt agctgcatcc acctagcctc 6840 
ccacgagcca cttatcccca cttataatca 6900 
ttcccgacgt tgtggtatat cctatagatg 6960 
tctcttgcct tcctatactc tctggagagt 7020 
gtcatttgtg gctatgtgac atagttctgg 7080 
gggcttcctt tctgggatga gggcaaaacg 714 0 



<210> 63 
<211> 44100 
<212> ADN 

<213> Homo sapiens 
<400> 63 

tgcctttatt tccgtaggct ggtcatatgg 
agcgaatgaa accaaaatca ctttaccttc 
ttggcccgtg tgtcgcatac cgccctctgg 
ccgccgctcg acgccatctt gcctactttg 
ctgagctccc ttttatccaa taagagagcg 
gagaatcgac agcgtcggcc atcgtttcct 
cccccgagcg gctcggcgga gaggcgcggt 
tacaggctta cggcaggatg cgcagcgggg 



cgctagcact cacataaagc taccgaggag 60 
acagcacgag gccgtcgtcc ctctcgatat 120 
acgtggtgat caaataaact ccctagctcc 180 
atcctcgcag ggaggacaac atccgcccta 240 
ggatgagtta aggagtgcca ggattggctg 300 
gcgtgcgaag atttgatgaa cgaggtgccg 360 
gggtgacaga agctttcttg tcccacccac 420 
agagggggcg gggccgcagg gggcggggcc 4 80 
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gatcgatctc ctccggctcc gacgtcctcg gcctgccggg tcccgggtcc tttgcggcgc 540 
tagggtgggc gaacccagag cgacgctccg ggacgatgtg gggcagcgat cgcctggcgg 600 
gtgctggggg aggcggggcg gcagtgactg nggccttcac caacgctcgc gactgcttcc 660 
tccacctgcc gcggcgtctc gtggcccagc tgcatctgct gcaggcaacc tgccggcccc 720 
gagccacctg atcttcagcc tggggtcgga cgaggccgaa gcctctcagg gacgcggcgg 780 
gacaccggct gccacccggg cgccgccgaa gcgcgcagag atcagggtcc ctcgacggca 840 
gggcccttct gggtagtctc tggatcccac aagtccagtg cagccctggg ctcgtcttat 900 
cccaggtctt ttcacttggt gaaactgaac cragaaacgt cctaatattc taccactgtt 960 
tttataaata ttccttattc caggctggaa aagctcctga gaagtggttt gtttttatta 1020 
ttttaaaagg tgttttcctt gccagccatt tccagttaac ctgcgctgct gccgtccggg 1080 
ccgcgagagc gggacgcaga gttgttggcg gagcccctgt cggttcccgg ggactaagca 1140 
ccgcgtccca tgagcgggaa aggttaatac aatgatggtt ctgccctgcg tcgctgacgc 1200 
ggaacacagc tgtagtgtgt taggaacaca taacgtagtt aagatcactt gaagctctgc 1260 
gatcagtcgc ccttctggac gttgtggtta ggatgtttca cagttctaac cactggtgga 1320 
gatacagcgt ccatattttc ataattaaaa atagaggcac atggtctcac gagtttgagt 1380 
gtacttatgg gggcaaaagg acggcgtatt tgaaatcctc ataaatcctg gatgcatggt 1440 
acccaccagt ggctaatcta tgcaatgaat agagtttgca ataatttcaa gcatcccttc 1500 
tttccacttg agttacttcc ccatacctag gggaagatat ttttggtcca ctgaaaacat 1560 
gagttcagca gaatcctcct atcatcgtcg ttattatttt ttaccactaa gtagacaatc 1620 
ttttggtttt tgatgggctt tatggctaga gacaaatcag tcactgtcac caagttccag 1680 
gtagaagttg gttcagtgct ctgtcagctt cgatgggatt tttcaacatg ttttcaaatc 1740 
tgcacttaat agtaggaatg ctttcttaca gtaactctaa tttgatccta agatgtagtt 1800 
gttaccttac attcatcact gtttaagaat ttagtggtct tgatctttgt tttaaatttt 1860 
gagccttcgg gaagtactta taagaattaa ttcatgcata tctttttgaa atgtaaatgt 1920 
ctttagccct ggaacaaatt gctgtttctg ttcagcccat attagcagaa taggtcaact 1980 
ttactttcta attatcaatg taataagttt attactttat agattccata aatctataca 2040 
tttattcctc gatgaattat ataaatttat agaatttatg ttttatagaa aatttggaaa 2100 
gcatggaaaa ttattaacaa gaaaataagt tacccataat cccagaactt agaggtgact 2160 
aatgttgaca gtttggatca aatcttccag ttttgtttct aatctttatt tttaacataa 2220 
atgaggtcct gtatacacac gtacagtttt gtgtcctggt gtttttattt aatgttatta 2280 
tgagtgtttt attttgttaa aaggtcatca ttttaagttg ttaattagta ttctagcaca 2340 
aatttgccat aatttattta attgtttact atgattgacc atttagattg tacttaattt 2400 
ttaggcatta gaagtgataa actatatttt aatcagacgt tgaaaataac acatctttgt 24 60 
ttagaaaaca tcattttatt tctggttgtc taggatagat tcccagaatt cttgggttag 2520 
aggccataga taattatgaa agcagaaaga ttcacaagtt gggagttaat acttgaatta 2580 
ctttatttgg ggtgaagcat tgagtgcata atacagatca tgcagtaatg ggaagaaggg 2640 
ttggaacaat ggttttctgg cctatgtcag acttaccttg aagcttttaa gaatacagat 2700 
gttctgatca accctcagac ctattaaatc agacctaaaa tcttagggaa taggctttag 2760 
gcatctctaa ttttaaaaaa tttattcagg ctacttggat gcacaaaaga gttgagacct 2820 
actgtcctag aatcatagaa ttttaatgac gatagagacc ttaagcatct aggtcgtttc 2880 
tgtactttta catgtaagga aactggcatt cctaggccag taccattgcc atgcagctaa 2940 
tttgccctct tgtctatagc tcactctgca tcacccaacc taccgttctc actgtttctt 3000 
ctataaccaa tctccttccc acttctgttc tcttactcat gccattcttc cctcagtcat 3060 
ttttcttcct tccatacaaa ttccatgtct ttaaaaagga ataatcctac ctcctccaca 3120 
tagctttcca attctctgtt gcccacattt gtctcccttt caatacttct ctgttgtgtt 3180 
atgtgacaca tcacatttga tatactctgt actgtgtttc aagtattgta ttctcttgtt 3240 
tactcaagtc attatttcag gactgactac ccagtagatg ctttaagtca ggatttctca 3300 
accttggcac tgttgacatt ttgagctgga taattttttg ttttgggggc tctcctgtac 3360 
attttaagat gtttaacagc acccttggcc tctatccagt agacgcctgt actgcctccc 3420 
cctatctgtg acaaccaaaa aggtcttcag acattgtcag atgtctactg aaggacaaaa 3480 
tcacctctgg ttgagaacca ccgcttcaac taagttatct tctctgtact cagaacttga 3540 
tgtgattgca gcagggggag aggattcata tacacagtga atgcaaacga acctaaatca 3600 
ccattcggat atggccacac aattttcatt tcccttgtgt tagcaagaga taccctaggc 3660 
tttggacctg attattccta aggcattctg atgtatggtt ttacctgcag atttcctggt 3720 
aatactgata cctcagtttg ggtcaaagaa ggtcaattaa ttgattgatt tgatttgact 3780 
cctggaaaag acgctccttt ctagctgtct ctttcttctc tttacctgaa tagccagggc 3840 
tctgtggttc aagtgaagta ttttgacata aaaattaact tagaacattg gtctgcagag 3900 
tttgctcaat ataactgagc acatattgtg gctttatgga gctggttact actttttgac 3960 
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caaataaata attagaagta tttttcctcc tcaataaggt tcatttttcc ttttttcagr 4020 
gagctggtag agtttccttt tttgatattt cagggcatct ttcatatttc catctcttaa 4030 
gtttcttcat atgaagtaga atttatctgg attatgtatt gctgactctg atgaaaaccc 4140 
atagaaagca tctggggctt gatcaccttc attcttgtaa tagctcacac ggttacagcr 4200 
gatatggtaa cttaagactt ttgattccaa atctaggcaa aatacactca gttgaaagaa 4260 
tttgtcagcc agaacagttg gactgttctg tgaaaattgt gagaaaaatt acacaactaa 4320 
gtgatacatg atgatggctt tcttaaatat aaaattgtaa taacatggtt aatttccagt 4380 
acgttatatt gtcccagaag tggctccaac attgtttgaa atttgtctca tttaaagaaa 4440 
cataagctgg ctatggtggc tcacgcctgt aatcccagca ctttgggagg ctgaggcagg 4500 
cagatcacct gaggtcagga gttcgagacc agcctggcca acatggtaaa accccatctc 4560 
tactaaaaat acaaaaatta gccgggcatt tggtgggggc ctgtaatccc agcracttgg 4620 
gaggctgagg caggagaatt gcttgaatct gggaggtgga ggttgcagtg agccgagatr 4 680 
gtgccactgc cctccagcct gggtgacaga gtgagtctcc gtctcaagaa aaaaaaaaaa 4740 
aaaagcaaga aacataaaga ctgggcatgt tggctcatgc ctgtaatccc agcactttga 4800 
gagactgagg tgggaagatc acttgagccc aggaggttaa ggctgcagtg agccgtgatu 4860 
ttgccactgt actcgagcct gggcaacaca gtgagatcct gtctcaggaa aaaaaaaatt 4920 
gcatgtaaat gaatgaattt gatatttaat attttaaatt atgaaaactg ttctgtagag 4980 
atgtagatct tgccatgttg cccaggctgg ctttgaactt ctgggctcaa acaatcctcc 5040 
tgtctcagtc tcccaaagta taaagattac acatgtgagc cactgcacct ggcctaatat 5100 
ttttaactta atgaatttat tttgatataa ataaattaat aacactgaag cttcctgata 5160 
taataagtct ttttgtgtgt gtgacgggtt ctcactctgt tgcccagact ggagtgtaa~ 5220 
ggcactatca tggctcactg tagcctcaac ctccctgact caagtgatcc tcccacctcg 5280 
gcttcctgag tagatgggac cacaggcgta tgccaccaca cctggctgat ttttaaaatr 5340 
tattattgat acatattaat aaaattattt ttattttaaa aatgatatat gtggctgggc 5400 
atggtggctc atgcctgtaa tcccgacagt ttgggaggcc gaggtgggag gatcacttga 5460 
gaccaggagc ttaagaccag cctaagcaac atagtgagat cccatctcta tagaaaaaaa 5520 
aaatggctag gtgtggtggt gtatgcctat attcccagct actcaggaga ctgaggtgag 5580 
aggattgcta gagcccagga gtttcaagtt acagtgacct atgattgtgc cagtgcactc 5640 
cagcctgggc aacagagcaa aatcctgtct caaaaaaaaa aaaagttcga aaatgcttat 5700 
gatgcaatat aagtagtgga aaaggatatt aaattgtgcc tatatgaaca caactatatg 5760 
aaaaacttgc acatagagaa aaggattaac aagaaataga ccaaattgtt cacatggttg 5820 
tcttgtttgt ggagagaata tcagtagttc atttgtttcc ttccaagttt atatgttttc 5880 
cgaggtctct ataatgagtt tgtaattgtt taatcataga aaaccctttt ttggtccttg 5940 
gccacaaact tacatgtttt aatgtaattg cttttttaat gagaataaat gttatatttt 6000 
gcttttttaa aacctatatt cccatagtta tatgagccct tacaattatt aagaggctgc 6060 
ataatataac gtttctggaa gggtacagaa gaaacagcag taattacctc tgagaacaga 6120 
gacatggctt cacattttac ccttttgtac gttttgtgct tttgccacat gcatttatta 6180 
ttcttccaat aaataagtaa ataaatatgg attgtatact ccatctggtt ggtgtttcat 6240 
aattctaaaa ttatattgct acatttttaa agatgatatg tgtttctact tattaacgta 6300 
tatgttaaaa tagtaaattt atatcttatt taataatttc cctattgata gacatttaag 6360 
acagtctcaa gtgttcacta tcatagaaaa tactgcacag atagcttttg ctatagtttc 6420 
ttttttcttt gaatcgttaa ttgggaataa atgctcaaat agttatatgt ggctcaactg 6480 
ctatttaagt ttattgactg actgctgcca ttttgaattc tgaaggggtt gattaaattt 6540 
ataatgctgc cataagaata taagggtatt ggcttcatta gcatccacca gcattgggtg 6600 
ttggaaatga ttatagattt ttaaatgcta caacaaatgt agataacaga gaactatcta 6660 
tagaactctt tttggacatg tgaattgtaa taatagttta ttttcatgtg aatccagaaa 6720 
aatgtatacg aaaacctttt ttcctctcat ttcttatatg aatagaatca agctatagaa 6780 
gtggtctgga gtcaccagcc tgcattcttg agctgggtgg aaggcaggca ttttagtgat 6840 
gggggacagg taagcacatg tgatggcaat aactttcttc taatatcaca taatatagca 6900 
atagaaataa aattaaaagt ttagattttt tgttaaagga ggtgagatgt cacctaattt 6960 
gtatgctatt atgtaactag tctaggatat tgaagctgac tatactctgt ttttaggtca 7020 
ttatcttgta gtttaccata ctccctactt gcttcttatt ctactattta actcattttc 7080 
cacatcccct aattttggtt tcatgaaatt atttttcctt ctgaattact aggttctact 7140 
tactattatt aaactttatt tctgacatat tttataacct tccatggtct cacttgatta 7200 
aaaataaaaa attcagctgg gtgcggtggc tcacacctat aatcccagca ctttgggagg 7260 
ccaaggtggg cggataattt gaggtcagga gttggagacc agcctgccca acgtggtgaa 7320 
accccccctc tctactaaaa attcaaaaat tagctgggca tggtggcagg tgcctgtaat 7380 
cccagctact caggaggctg aggcaggaga attgcttgaa cctgggaggt ggaggttgca 7440 
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gtgagctgag attgcactgc tgcacttcag ctgggtgaca agagcgaaac aatgtcttga 7500 
aaaaaaataa aaaataaaaa attctacaac acagggttat tatttttcca tttttgtttt 7560 
cccttatgag tttaatatgt ttagattata aacctgaaag cttgaatacc tatgtctatc 7620 
ttttgttttc ttatgtttat caagttattc ctttaaacat tttctaaact gtaagaataa 7680 
tgtgaggctg ggctcaatgg cttatgcctg taatcccagt gctttgggag gccaaggtgg 7740 
gaggaccact tgaggccacg agttcaagat tagcctggct aggcaacata gcaagaccct 7800 
atctctataa aaaaattaaa aaaattagct gggcatggta gcaaatgctt gtagtcccag 7860 
ctactcagca gactgaggta ggaggaatgc ttgagaccag gaatttgagt gacctatgai 7920 
tatgcactcc agcccgggca atagcaagac cctatctctt aaaagaagaa gatgtagtaa 7980 
taatacatat tcattataac tattttacca ttgaaagtaa aaaatgagtt tttacctttt 8040 
cccagtccca tcctcagaat ggggatctca gtagaccttt aggattggaa gaatgagatc 8100 
attcatattt tctgcaatta ttaccccaca aaatatttca gatacctttc catgtattac 8160 
aaacaatgtg catttaacat gtctctctct ttctctctct ctctgtgtgc gtcttcatga 8220 
tcctctgttg cagccctgcc agtaagacac tatctcctga agaatcactg ataggaacag 8280 
aaagtggact ggctaggcca ggagtcctta gcttcttagg gggcaggagc tgctttgtgc 8340 
tttctcagaa tcagatatat atgtggactg aaacatttaa aaacagaata gccaagggtg 8400 
ctatacgttt aaaacttata tagatggggc tacattgctc tctattacta atttcccatg 8460 
acaatacacg agagtgccat gtctttttaa cttgttttga gcacagacta atcttgttta 8520 
tgcatgtttt ttgatgagaa taggctactc atgagaaatc tgtaaaccta acactagtcc 8580 
cttgcatact ctaaattgtt gctagaatct taaaatttta gcaccagacg gaccttagaa 8640 
atcattaact ttggtgcttt gttctacaat acaaggagat ggaat atttt acccaggatt 8700 
gcttagcagg ttacagttct gccctctgag tacccagcac ttccctgtgg gcaacatcaa 8760 
cttcctgatt ttcaagtctt aattagtact ctgaagaatc ctacttgttt ttaactccca 8820 
tttgctttga agtgacttta cctgattttt ttagatccct tattgcagca atgccactaa 8880 
gaaactgagt ctctagcttc ttggtgggca ggagctgctt tgtgcttgct cagaatcatc 8940 
cttttcagta agggagatat tgaagagaaa tctactgagg agtctggggg tgaggcactc 9000 
agggaaatcc tgctccagtc cacaaaagca gagaggaagg gttggttacc tagagtattt 9060 
aacatgcaga ggctttggat tttactcctt taatccttgg aaatgcctat ggaaggggaa 9120 
aggaagtaag atggtgactc cagcttatag acatactagt gttacatata tttaaactat 9180 
aataggaggg tattattagt tttacttaac tttcaactgt gaaggattat acttctcaat 9240 
atttgtctcc agtgtctatt tcagtgtatt tttcactttt cttgaagcag catgtctgtt 9300 
gcaaaacttc tagaaataat gagaatattt atatattaga tcaagccata acttgatgat 9360 
atagtcattt cttcttatat tttttactta catttttaca ttttaatgat tactttcatt 9420 
tttgaaaaac atgtcatgct gagatgtatt tttcttcatt ctgtaattag ttatgaaaca 9480 
gtttttccta aaatgctgag tatatcaagt cttggctaag aataagtaat aaatatttgc 9540 
cacatgaaag actacacata tagccaggtg cagtggcttg cacctgtttt cccagctacc 9600 
caggaggctg aggcaggagg attgcttgag cccagggttt ccaggctgca gtgaactatg 9660 
attgtaccac tctactccag aatgggtgac agagccaggc cccatctctc aaaacagaaa 9720 
agaaagatta catagactac atatacaccc ccatccaaaa catacacaca catctactta 9780 
acctaaaatg gtaagaagat aacttcttat tttctaatat atgacacaga aaagtttttt 9840 
taaagtagtt ttaaattttt aattttttct aggtatttct caagccatgt tcccatgtgg 9900 
tatcttgtca acaagttgag gtggaacccc tctcagcaga tgattgggag atactggtaa 9960 
agaaaaccaa ataagaacta tctcatttaa ggttaaatta cttcacaata tcaatgtctt 10020 
tagctttctc taagctttat tatatattct gagttggttt tgaattataa gaatgaattg 10080 
gggccaggca cagtagctca tgcctatagt cccagcactt tgggaggcca aggcaggtgg 10140 
attgcttgag tccaggagtt caagaccagg ctgggcaaca tggtgaaacc ccgtatctac 10200 
taaaaataca aaaattagcc aggcatggta gtgcatgcca ttagtcccag tcacttggga 10260 
ggctgaggca ggagaatcgc ttgagcccgt aaagtcaagg ctgcagtgag tcaggatctt 10320 
gccattgtac tccagtctgg aaaacagagt gagaccttgt ctcaaataaa aaaagaatga 10380 
attgatagag atctaatgta caacctgaca actataggta ataaaattgt attggggatt 10440 
catgttaaat gagtagattt taactactct taccacaaaa acacaaaagt gggtaactgt 10500 
gagatgatgt atatgttaat ttacttcact atagtaacca ttatactatc tatatgtagc 10560 
tcataacacc atgtcgtgta tattaaatat gcacattaaa atttgttttt taaaaaaaga 10620 
attgagattt tttttaacta gatatggagt ggacaaaatg taaagtgaat tgatcttttc 10680 
gtctgttggt tctaggagct gcatgctgtt tcccttgaac aacatcttct agatcaaatt 10740 
cgaatagttt ttccaaaagc catttttcct gtttgggttg atcaacaaac gtacatattt 10800 
atccaaattg gtaggtgcta ttgtaatatt tgctgtcata ttctacacta tagcattgag 10860 
tccaaagtag aaatgaatgt gcactaatga gctttatttt ctacacagtt gcactaatac 10920 
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cagctgcctc ttatggaagg ctggaaacrg acaccaaact ccttattcag ccaaagacac 10980 
gccgagccaa agagaataca ttttcaaaag ctgatgctga atataaaaaa cttcatagtt 11040 
atggaagaga ccagaaagga atgatgaaag aacttcaaac caagcaactt cagtcaaaia 11100 
ctgtgggaat cactgaatct aatgaaaacg agtcagagat tccagttgac tcatcatcag 11160 
tagcaagttt atggactatg ataggaagca ttttttcctt tcaatctgag aagaaacaag 11220 
agacatcttg gggtttaact gaaatcaa^g cattcaaaaa tatgcagtca aaggttgttc 11280 
ctctagacaa tattttcaga gtatgcaaat ctcaacctcc tagtatatat aacgcgtcag 11340 
caacctctgt ttttcataaa cactgtgcca ttcatgtatt tccatgggac caggaatatt 11400 
ttgatgtaga gcccagcttt actgtgacat atggaaagct agttaagcta ctttctccaa 11460 
agcaacagca aagtaaaaca aaacaaaatg tgttatcacc tgaaaaagag aagcagatgt 11520 
cagagccact agatcaaaaa aaaattaggt cagatcataa tgaagaagat gagaaggccr 11580 
gtgtgctaca agtagtctgg aatggacttg aagaattgaa caatgccatc aaatatacca 11640 
aaaatgtaga agttctccat cttgggaaag tctgggttag tataaatttt ataacttggg 11700 
agaaatttta tgtggcttaa acatccccaa attatgaatt agaatagtat ttcatatata 11760 
aattgaaaat caattaaaaa gaaacacagt gcctaaaggc acttggggga cacatttacg 11820 
ctttgcagta aagtccttgt ttggataaag attgtatgtt ttctggccaa gtaagcttga 11880 
ataggtacaa gcttagatag gttcaggcca gagaggtcaa aattacttgc ctgagattgc 11940 
atagctagtg ttacaactag gattcaaacc caggcagatt gacttggggg ttcatcagga 12000 
tggagtgccc tacaaagcct cccatcttta atgcttgcag atttgttccc cagttaccga 12060 
aagcaacttg ttaatattag ggaaaagggc cagtgtaggg agagatccat ggcatgaggt 12120 
aaccttcctg ctgcatgtgg tggcacctgg antggaatgc atccaggagc tgcttaccct 12180 
gccggtgtct gctctttaat ttgtgtataa cggagaggaa gtagacaggg caactagtgc 12240 
tccagcccct catcctggcc acaaatatta atgctacctt tatatgacat aagtcactag 12300 
tccatttatt ggaacctaaa tttgaaccac tgtaaagtaa gacttcatag tgataaagag 12360 
aggaacttgt taggaaagag aataaaatag aaagagaagg ttgtctcctt ttgtagattt 12420 
tttttttttc tccaacagtt ttacctgtga cctttataca aataactgac aaagcattaa 12480 
tctctttggc ctacatcatt ttcttttcta tttttttttt ccacaagatg gagtttcact 12540 
cttcttgccc aagctggagt gcagtggcat gatctggctc actgcaacct ccgcctccca 12600 
cgttcaagtg gttctcctgc ctcagcctcc tgagtagctg ggactacagg catgcaccac 12660 
cacgcctggc taattttttg tatttttagt agaaactggg tttcaccatg ttagccagcc 12720 
tggtctggaa ctcctgacct caggtgatct gcctgcctcg gcctcccaaa gtgctgggat 12780 
tacaggcatg agccactgct cctggccggc ctacatcatt ttctaaagct ccagaccatt 12840 
cttttctttt cttttctttt cttttctttt cttttctttt cttttctttt cttttttctc 12900 
ttctcttctc ttctcttctc ttctcttctc ttctcttctc ttttcttttc tttttttgag 12960 
ttagaagctt gctttgttgc ccaggctgga gtgcagtggc accacctcca ctcactacaa 13020 
cctccacctc ccaggttcaa atgattctcc tgcctcagcc ttcagagtag ctgggactac 13080 
aagtgtgcgc caccactcct ggctaatttt tgtattttta gtagggacga ggtttcacca 13140 
tgttggccag gctagtcttg aactcctggt ctcaagtgat ccgcctgcct cagtctccca 13200 
aggtgctggg attacaggcg tgagccactg tgcctggcct cagatcatta ttttctgtta 13260 
gctttaaact gtccgttcag gagatcccac tgcatcctca aattcaaaat atctaacact 13320 
gagcttatga tttagctggt tctgtcatta gatgggaata tccttttatt tccttgaaat 13380 
tatatggtga gaacagggag aagtgctgat ggtaaagtcc tgtgattaag atagcaataa 13440 
ggactccgcc cttcccactc cactgaaggt tgaagagcca tggacaatga gaagtcacag 13500 
taggtgaaat caggtactaa aatggacttg gcttgagaga tcaaaattga tcacttggtg 13560 
atacaactaa caaattcatg ttaacttgaa cctttattac cctgtgaagc atggtgatta 13620 
aaaaaaaaca acaaacaaac aggaaacttg attgttaaat tctctttaag tcagaatatg 13680 
taccttagag tttttattta tgcttttgtc taccattaat atgtctgcac ctgctcttta 13740 
gaagttaata gagagtaaag tcgtctttat gtctttcagt gcttacttat atttgggaag 13800 
ttgagaaaaa tttttaacat cattattgat atatatatat atatatatat atatatatat 13860 
atatatatat atatatatat atagataatt tttttttttt tcttgagacg gagtctcact 13920 
ctgtcgccca ggccggagtg tggtggcgat ctccactcaa tgcaagctct gcctcccagg 13980 
ttcaagcgat tctcttgcct cagcctcccg agtagctagg atacaggctc ccaccaccac 14040 
gcctggctaa tttttgtagt tttagtagag acgaggtttc accatattgg ccacgctggt: 14100 
ctcaaactcc tgaccttgtg atccgcccac ctcggcctcc caaagtgctg ggattacagg 14160 
cgtgagccac tgcgcccggc tgaggtaaaa tttaaagtgt acaattcagt catttttagt 14220 
atatttatac tagttgtaca gccatcacca caatctaagt ttagaacatt ttcattaggg 14280 
ggtgggagaa attttactct gctttttaga ttaagtttct gtctggatct aatcatttaa 14340 
tcagacaatc aggcagattg tctgtgatta gttttggcca ttccagcttc ttcattggtt 14400 
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gttaactttc acaaataaag gctgctcaaa gattagaaat aacatttaat ttgaatgtaa 14460 
atgtgccata gtttaaaaga tgggtttggt gaatacagtc aaatacatac atttaaagct 14520 
ctaattctga agattatgta aagaaaagga aagaaatgta gggagaggat tgaaatgttc 14580 
atggtataac aatatctgaa catccatctg gtcacaccgt tggtatttga atgttt tgtc 14640 
ctcctcaaat tcatatgtcg aaatcccaac tcccaaggtg atcgtattag gaggtgtggt 14700 
ctttgggaag tgattaggtc atgaaggtga agccttcatg aatgggattc gtgctcttat 14760 
aaaagagaac tgtgagaaat aagtttctgt cgtttgttag ccacccagtt taggatattt 14820 
tgatatagca gcctgcatgg actgagacaa ctatgagtta ttatgatagc ttctgttatt 14880 
tcacctaaat tcatagaagc taatatatca atatttatgc tatgaaatat ttcttaacca 14940 
agctttgaat atatttatat ttttgtttat ttttaaattt cagattccag atgacctgag 15000 
gaagagacta aatatagaaa tgcatgccgt agtcaggata actccagtgg aagttacccc 15060 
taaaattcca agatctctaa agttacaacc tagagagaat ttagtgagtt caaatatata 15120 
tgttacatca aaattctttt acacgttttg taagatttct agttgcttta gctaagtaat 15180 
aagaatgttg tattcctttt tgatacaaat ctttttttat' tgtgttaaac tatatataac 15240 
ataaaatatg ccatgttcgc catttttaag tgtataattc aaaggcatta attacattca 15300 
taatattgta caaccatcac cactatctat atccagaact tttccatcac cccaaagaga 15360 
aacttggtac ccattaaaca ataattcccc gtccactcct ttccccagtc cctggtaatc 15420 
tctaatgtat attgtgtctc tatgaattta cttattctag atatttcata tataagtaga 15480 
agtatgcatt tgtcttatgt atctgactta tttcatttaa cataatgttt tcaaggctca 15540 
tctgtgttgt atgtatcaga atgttattcc ttttcatggc tgaatactat tccattgact 15600 
gcatatacca catttgttta tccattcatc tgttgatgga cacttgggtt gtttccacat 15660 
ttttggctgc tgtgaataat gctacagtga acattggtgt acaagtatct gtttgagttc 15720 
ctcttttcag ctcctttggg atatacctag gaattatgtt taactttttg agaagctgag 15780 
aaatctttaa taaatgataa cacaaatact tatatttgcc aatgcaaata tgaatatttt 15840 
tggcttttaa gagattgatc attttgccac gtggttgtaa ttaaaaaaaa ttgtcccatg 15900 
ttgtttcagt attaatattg tagcctaaaa gagtgctaga ctgttttact ttttactcag 15960 
ttaattcttt ggatactggt agagtcagga aatgagatat tgaacttaaa gatctttgca 16020 
ggtggggtcc agtggctcac acctgtaatc ctagcacttt gggaagctga ggtgggagga 16080 
ttgcttgagg ccaagagttt gagaatagcc tgggcaacat agcaagaccc catctctaca 16140 
aaaaaattaa aaaaaaaatt aagccaggcg tggtagctca cgcctgttat cccaacactt 16200 
cgggaggctg agatgggtgg atcacttgag gtcaggagtt ggagaccagc ctggccaaca 16260 
tggtgaaacc ccatctctac taaaaatacc aaaattatcg gggcgtggtg ctaatcctgt 16320 
aatctcagct actcaggagg ctgaggcagg agaaccactt gaactgagga ggtggaagtt 16380 
gcagtgagcc tagatctcac cactgcactc cagcctgggt aacagagcga gactctattt 16440 
caaaaaaagt aaaaataaaa attagacaca tgtggtggca catgcctgta gtcctagcta 16500 
ctcaggaggc tgactgaagt gggaggatct cttgagccca ggagttccac actgcagtga 16560 
gctatgattg tgccactgca ctccagccta ggcaatatct caaaaaaaat ttttttaaat 16620 
agattattag gccagacgtg gtggctcatg ccagtaatcc cagcactttg gaaggccaag 16680 
gcaggcggat cacctgaggc caggagtttg agaccagcct ggccaacatg gtgaaacccc 16740 
atgtctacca aaaatacaaa aattagctgc aatgtctata atcccagcta cttgggagcc 16800 
tgaggcaagc gaatcgcttg aacccgggag gcagaggttg cagtgagtgg agactgcgcc 16860 
actgcactcc agcctgggcg atacagcgag attctgtctc aaagaaaaag gaatttgttt 16920 
tcctgtcttt atcgtagagg gaggaaaggg agaatggggt tggaatggtt attgagtgag 16980 
ccacattatg gtagatgtat cactgggcat agagaaaagg agcatttaaa acttttccgc 17040 
ctaacagatg tttcttcagg ctacactgca ctcattgtgc taactgtaat gtcaaatccc 17100 
agacctgtgc ctatagaaca tgaacatcct tcattggatt tgtttggtca ggcttacact 17160 
ttattaggaa gatcagatgt taaaataagg gtgttaaagt taagttcaga tatgaggata 17220 
attcattact attccttttt ctggcagcct aaagacataa gtgaagaaga cataaaaact 17280 
gtattttatt catggctaca gcagtctact accaccatgc ttcctttggt aatatcagag 17340 
gaagaattta ttaagctgga aactaaagat ggtgagtaca tttgttattt tgactttttt 17400 
ttctatttaa atagttgtac atttttaatt gttcttgcaa cctgtcatac ctgtgaacag 17460 
tatgtgaata gtgaaatata attatgataa ttaaacagta gtttttatgt attgaaaaat 17520 
atctttggcc gggtgcagtg gctcatgcct gtaatcccag cactttggga ggccgaggca 17580 
ggcggatcac ttgaggccag gagttcgaga gcagcctgcc aacatggcgc aaccctatct 17640 
atacaaaaaa atacaaaaat tagcctgaca tagtggtgta tgcctgtagt cccagctact 17700 
tgggaggctg aggcagaagg atcacttgag cccaggaggt ctgtgttcct gccactgcac 17760 
tccagcctgg gcagcagagt gagaccctgt tggggggaaa aaaaaaaaag tctttaactt 17820 
aaataaattt gacatttaaa atcttaaatt atttcatctc tgtttcagta ctaactctgc 17880 
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atttattact 
ggaaaaagaa 
aatacaagta 
ataataaagt 
aagagtaagg 
acaaattatt 
aatagagttg 
aacaaatgaa 
tttactgcac 
atcagatcac 
tttaaaagac 
cactgcagcc 
gggaccacag 
tttcaccatg 
cccacccaaa 
tttaagagtc 
gtgcagtggc 
tgcctcagct 
tgtagtttta 
ctcaagtgat 
cacccagcca 
cataaaattg 
tctttatttt 
tgtgaaaagg 
tattaaggca 
gtacattgtt 
tggtataaca 
actttgaaat 
aaagaagaaa 
gggtaagaag 
agttttcaat 
cagtagatat 
cgtctttttt 
ccttgtcttc 
atcgatgaga 
attcttagaa 
aaaaatattt 
atttgtgttt 
gggctagata 
taatatgaga 
tgtagtagta 
attaaacgat 
tttttttttt 
tctcagctca 
aagtagctgg 
gagatggggt 
ccaaagtgct 
gactctcatg 
atgtttgtaa 
aataagtttt 
taaactaaat 
tctattaggg 
agcttggagg 
cgggtggatc 
tctctactaa 
ctcgggaggc 
agatcatgcc 
aaaaaaaaaa 



ttctttttaa 
aaagataaaa 
atagcatgtt 
atgaagttcc 
aataacttga 
gacttaacct 
atcatgttaa 
aacgtagttt 
aacccatctt 
ttttctttgc 
ggtgtctcac 
tcgacctccc 
gcgaatgcca 
ttgcccagaa 
gttgtgggat 
atcttttttt 
acactctcgg 
tccctagtag 
gtagagacga 
ctgccctcct 
agagtggtct 
aagatactct 
tgaaatgtta 
ataattgtga 
ataacattct 
attgtcaagg 
gaatcagcaa 
gtaaaactga 
acagtgagga 
ttatggccaa 
gtaaatatta 
tttttcaagg 
tttttctctt 
ttcgataaca 
agaaagcaac 
caaataaata 
caaattaagt 
ttctcaactt 
aaatataaaa 
atctcttata 
gggatttgat 
aaagtcaaaa 
tttgagatgg 
ttgcaacctc 
gattacaagc 
ttcaccatgt 
gggattacag 
tgatcatgta 
aatataatct 
tagttatcct 
catttggggg 
caaaactttt 
ctgggcgcgg 
acttgaggtc 
aaatacagaa 
taaggcagga 
actgcactcc 
gcttgaagtc 



taggactgaa 
atatttttct 
attgaatatn 
ttgtaacacc 
tttaaaatat 
aaatttaaaa 
ctggtaaatg 
taagggtttg 
attttgacag 
ttccataagt 
tttgtcgccc 
aggctcaggt 
tgatgcctgg 
ttgtcttgaa 
tacaagtgtg 
tttttttgag 
ctcactgcaa 
ctaggattac 
gatttcacca 
cagcctccca 
ttttacaata 
agtcatttag 
ttgaaggaat 
cacaaatcaa 
ttctgcttgt 
gtgtttaaat 
tttagttttc 
tttttccttg 
aattgacttt 
actagcatgt 
aagtagatgt 
attgtctcta 
tatttttatg 
agaagtctga 
tagatatcac 
cattttaaaa 
tattccttca 
ttaaaacaaa 
aatatttttt 
aacactacct 
ttcttagaat 
tgtttatagc 
actctcactt 
cgcctcctgg 
atgcaccacc 
tggccaggct 
gcgtgaacca 
aagtggcagg 
acagattgat 
cagtacttca 
ctagaggtgt 
agtaactgca 
tggctcacac 
aggagtttga 
attagccagg 
gaattgctcg 
agcctgggtg 
agattcgaca 



ggaattttct 
gttgagtccc 
taataaaata 
ttgcattgtg 
tttattctgt 
atgaatgcct 
gatcatgatt 
attttttaaa 
ttcttaaatt 
ttttttatta 
aggctggagt 
gattct ccca 
ctaatttttg 
ctcctgggtt 
agccactgcg 
atggagtctc 
cctccacctc 
aggcgcatgc 
tgttggccag 
aagtgctggg 
ttattttttg 
aatttcattg 
accatttgga 
aattatagat 
tgaccataaa 
aatgatcttg 
tgggacccga 
caactgtagg 
attcttcctt 
tagacatgtt 
taatgtcaat 
tcttcacgcc 
tttttatcca 
agcttattag 
gtggatcata 
gttaaagcca 
ctgtcttgta 
tatttaaaaa 
aaactcctct 
cttagaagtc 
ggtataatct 
acagtgttta 
tgtcactcag 
gttcaagcaa 
acacctgcct 
ggtctcaagt 
ctgtgcccag 
cagtcacagt 
actggatttc 
aaagcaccca 
ttttttatgt 
tattttaaaa 
ctgtaattcc 
gacgagcctg 
tgtggtggtg 
aacttgggag 
acagagcaag 
ttaatcagta 



ctgagtatag 
aatttgct gc 
ctatttgt t a 
aagtgtatt a 
aatctcttta 
tagcacaatt 
taaaattctt 
ttcctatttt 
cgcaactctt 
ttatattatt 
gcagtggcat 
cctcagcctc 
tatgttttgt 
caagcagttg 
cccagctatt 
actctgt cac 
ctgggttcaa 
caccatgccc 
gctgct cttg 
att ct aagtg 
attaggacat 
ttttggaact 
gaagatacaa 
aaaaatatac 
tatttatatt 
catgcataat 
gaaaaacatg 
tccttctaga 
ttttaaagct 
tttaacacta 
aagtgatctt 
tagcttataa 
tccctggtgg 
aaattttact 
tatgcttgaa 
aaaacattag 
ttactgtaat 
attcctcttt 
taatttccat 
tccacagaag 
gtaaatgttt 
ttaatataaa 
gctggagtgc 
tccttccgca 
aattttttgt 
gatccgcctg 
cataaagtaa 
caagaagtag 
ataggtaatg 
tttatgatta 
gttaagattc 
gtaataaaac 
agcactttgg 
agcaacatgg 
ggcacctgta 
gcagaggttg 
actccgt ct c 
tactttctct 



t tcattctt g 
agaagactac 
catatgattg 
aaaacctgct 
aattatctgt 
aagttccaag 
ctaggattga 
tacatgcaat 
cagaaatatt 
attttttttt 
gat catggct 
ccaagtagct 
agagataggg 
ttctgccttg 
ctagaagtat 
ccaggctgga 
gtgattctcc 
tgctattttt 
aactcctgac 
t aaaccacca 
r cattcttgt 
agacattgtt 
atgtaagaat 
ctgtaaaatg 
ccctggatgg 
ttattctctc 
caaaagacat 
t cctatggta 
gagctctttg 
tatctggcag 
aataatgcat 
tttgccttgt 
taggggataa 
ttgagaattg 
taaaacaata 
ttgaatgttt 
aatttggatt 
tgattaagta 
atttcttata 
ctttggtaga 
tagtaaaagg 
ataaaatctc 
agtgttgcaa 
tcagcctcct 
atttttagta 
cctcagcctc 
aatctcttca 
tttaaagttc 
tttaagagaa 
tgttgattac 
cttaaggagt 
taattttaaa 
gaggccaagg 
tgaaaccttg 
atcccagcta 
cagtgagccg 
aaaaaaaaaa 
caagtagggg 



17940 
18000 
18060 
18120 
18180 
18240 
18300 
18360 
18420 
18480 
18540 
18600 
18660 
18720 
18780 
18840 
18900 
18960 
19020 
19080 
19140 
19200 
19260 
19320 
19380 
19440 
19500 
19560 
19620 
19680 
19740 
19800 
19860 
19920 
19980 
20040 
20100 
20160 
20220 
20280 
20340 
20400 
20460 
20520 
20580 
20640 
20700 
20760 
20820 
20880 
20940 
21000 
21060 
21120 
21180 
21240 
21300 
21360 
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acaatttcta 
gtctataatc 
gagactagcc 
cccaatcagc 
aggaggatca 
ctccagcctg 
taaattaatt 
cctgcttcag 
ggcgtatcct 
ctgatgtctc 
agtggttaag 
gggttttgac 
gacatatgga 
ggggagtgat 
aattatatgg 
tgttgaacca 
ctacattgct 
agtgattagt 
aaatctggcc 
agaggttgta 
tgtgactgaa 
aactttagcc 
agttgactgt 
cattagaaag 
tagtctttaa 
tttgataaaa 
aactttttgt 
ttagaatata 
ggttgcttca 
accatataac 
aaaaaatatt 
catatagttc 
gtaactcacc 
ctaggcagat 
ttttcccaca 
aaactgggta 
ttcttttttt 
tgcgatctcg 
ctcccgagta 
tagtagagat 
gatctgcctg 
cctccttttc 
ttgaaccatg 
ttttatagtt 
cccagcactg 
aaaacataca 
ttgtcctgct 
acagtcctga 
ttaaggtctt 
cagagaataa 
agttgtccta 
aacttcatgg 
atttactctt 
caaattctag 
ggctactgtg 
atgaagatat 
ccagggtgac 
gtaggagcat 



agattttagt 
ccagcacttt 
tgggcaacat 
tgggtgtggt 
cctttgccag 
gatgacacag 
aactacactg 
tcttttatca 
ccttggagca 
ttgttgcagg 
gtgtgttcat 
catctattat 
aagcattcat 
gacgaataag 
tttttctttt 
gccttgcata 
gagttttatc 
ttgcagtttt 
tcataaaatg 
taaaattgag 
tatattggga 
aaagcaatct 
aaagctttac 
acaggaatgt 
cttttctgtt 
tttctaaaac 
agactacatt 
ct ctaattgg 
ggggagagaa 
acttttgtac 
gggaagattt 
caactaatca 
aggaagtttg 
gcatttgcat 
tcctactttt 
taaatgaata 
ttttttttga 
gctcactata 
attgggacta 
ggggtttcac 
ccttggtttc 
tgagttttat 
ttgatgaaca 
aaatcaatat 
aaatgatact 
aaaaacccta 
ggatgacctt 
tgcggtgcag 
gttcttttgt 
tatatgtgtt 
tagactgtaa 
ttagtccttt 
ttgttcattt 
gagaaaaaga 
tatgagtagc 
tccctgggct 
caacaaggag 
ataacctaaa 



cttttaaaat 

gtggggccga 

ggcaaaaccc 

gttacactcc 

ggcgtttgag 

caagcccctt 

ggaaggcaaa 

tgtaactatg 

catcactcac 

acttaggaat 

ttttctgtaa 

atagggtggg 

ttattcacta" 

actgatgtt c 

ttaggctatt 

cctgtgataa 

tgctaatgtt 

ctgtttttgt 

agatgggaag 

gctgaatctt 

attcctataa 

gtaaagaagc 

gaggtatgag 

tatacataat 

tatcatttag 

tctccatatt 

tctggaagtg 

tataaatgat 

agtaggaggc 

ttttaaagtc 

tactttgaac 

tgaacttgtg 

aagccaaatt 

ttgattttaa 

tttattttgt 

catgcataca 

gacagagtct 

gcctccacct 

caggtgcatg 

catgttggcc 

ccaaagtgct 

aaaatttgat 

agtttttgtg 

cgagcttttc 

gaaaccattt 

gaggtggctt 

gacctcattg 

agccagcggc 

cagtcagcat 

atgttaagtg 

tagcaaaatt 

agggtttttc 

gacaaatatt 

agggtgaaca 

cagccctttc 

ttacaggtca 

atgacagcat 

ctgggggtga 



ttattaacta 
ggcagatgga 
cgtctctaca 
tgaagtccca 
gctgcaggga 
tctcaaaaaa 
attcagcatt 
tatatttttt 
agcctcctgg 
ggagctcttt 
catttaataa 
ttttgaccat 
atatttctgt 
tccatgccct 
aggtgttgat 
ataccacgta 
ctgttgagct 
gttgtctttg 
tattctctcc 
ggtggttgcc 
agcaattatt 
atttgacaaa 
tatggtaaca 
gctgtcaatc 
tcattaaaat 
taatggaggc 
ctcactgaca 
ctctgaattg 
tgtggacagc 
cttaacattt 
agttaatttt 
tatttcctgt 
tgtgtttcaa 
atgaatcttg 
tgtaagccat 
ggaattatag 
tgctctgtag 
cccaggttca 
ccaccacacc 
aggctgatct 
gggattacta 
actttactgc 
atgggtatat 
tagtgctttc 
catatcttct 
tctcagaggc 
ctggactgcc 
ttgctcatgg 
ttttagtctt 
ttgtgtttga 
ggtagagtaa 
attctccctt 
tgtcaaatgc 
gtattagcgc 
ttggctttct 
ataaatggaa 
acactatgcg 
ggtgggataa 



gtctgagcat 
tcacttgagc 
acaaatgcac 
gctactcggg 
gctgggttca 
aaaaagataa 
tttttatagc 
acagaggagt 
gacgcccttt 
tactcacagg 
cttttcattt 
ctattatata 
gtgtctgctt 
ttttctgtgt 
agggttgagt 
gttgtggtgt 
tttgtccatt 
tctggttttg 
tctt cttttg 
acaatgacag 
ttctagggaa 
ctggatgccc 
ctctatataa 
taataaatac 
ttctttggct 
ctattttttt 
ccactctgaa 
ctatggaaaa 
aatgaggaga 
acattattat 
tcccccatgg 
tctttgtaaa 
atatagcaac 
atcccttact 
ctaaaattct 
tagcatattc 
cccaggctgg 
agcaattctc 
tggctaattt 
caaactcctg 
gcataagcca 
acgctttgag 
taataaaata 
aaaaggacaa 
gtattaagga 
agtgtggatg 
tgctgt cccg 
taaatgcatc 
aacaataaat 
ggcccctgat 
aaacagtgtg 
acttattgtt 
ttgtgcacag 
agaacgatac 
tggattgctt 
attcagagag 
agaagtatac 
ggagttatca 



ggtggct tgt. 
ccaggagttg 
acacaaaaaa 
aggctgaggc 
caccactgcg 
aaaattaaat 
taaattttat 
gaattcctt a 
gtctcggcag 
aggaaaggta 
atctttcttr 
gggtttatac 
ttaggtgttg 
cagttgatac 
aacttacaaa 
atcattcttr 
taagtttgaa 
ctatccgtgr 
tttttttgga 
gaactattt c 
gtggaaaat c 
atgtggagag 
atcccttttt 
acatatcatc 
ttctaatgtt 
ttctagccag 
aaattagtac 
ctgggagaat 
attacagttc 
ctattcaatt 
gtaccgctgt 
tttaaacttt 
tccaggatct 
ctcacttatg 
caatgggatg 
cttttctttt 
agtgcagtgg 
gtgcctcaac 
ttgtattttt 
acctcaaagr 
ctgcacctgg 
actgtattaa 
tagatcaaat 
cctgaatttt 
aaaaggcttg 
cagccatctg 
gaacatgagc 
caccactggc 
ctactctctt 
ggcattctac 
aaaatt ctgc 
taatttacag 
tctgtattct 
taataatgat 
tgtattctac 
attaatttga 
acagagtagt 
gggaaggctt 
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tttggaggag ttgacaactg agccgagttt tgatggaaga gtagaaatta gcatgaacca 24900 
atttcatgct aataaagaag caaaggaagc gtggtctaca ggcaaaagca cagaggtaca 24960 
ggaagtaatg atatgttggg gaataccctg ttgactggag ct tagagtgc aaggagagga 2502C 
gtgctaggga ggtgaggttg gagggtttgg cagcattgac ttgcticaag gtztcutiaaga 25080 
gctgaaatag atataaaatg caactaagag tggcttggat tattattacc tagtgtgtta 25140 
atctcaaatt ttgaaatcta tagcatctat aggactggtg ttactaatct tacactcgac 25200 
ctgttactgt tcttatacta gatctattag tccagtgttt aagggagtgg tgcagatttc 25260 
taggtcagga caggactcag atgracatta ttaatgccta tttcagttct gaccttctca 25320 
tatgaaacct tataagacct ggggtaggaa gagattgttc tggaagtcat aggaatatga 25380 
actgtatttt gtttaacaaa caatacagta tggaaattta tcacccttcc agaatattta 25440 
tttcagagac aaatttttat cattcgttca tttatttcat aagatccacg agtagggaac 25500 
ctcactagac attgctctga gtatatggtc tgagtttgca gtacctcttg tgtctccat- 25560 
agatttatta ggtcctcaat agataaatca gggaataact agatggattc attttttaaa 25620 
gacatgaaag agcgatacca tacatactgc accttaaagg tcaaccttag agtatcatta 25680 
tttttaatga atgtataatt tttaaatttc atgtttactt ttcctaagct tttgcactar 25740 
attgcttaat tccagctttg aatgatatga taaaagagtt tatctccatg ggaagtttgg 25800 
ttgcactgat tgccacaagt cagtctcagc aatctctaca tcctttactt gtttctgctc 25860 
aaggagttca catatttcag tgcgtccaac acattcagcc tcctaatcag gtaatacact 25920 
acttgtaagg attattgaat tatgtccctt ttatagaaat tatttttcaa ttttattagt 25980 
aattcgtggc tttaaattta tgcttctctt aatgatttta aggatatgta agtcaacatt 26040 
tggtgcatat tgtgctagag gcataaatta taatttatag ccacctgaaa tgttagtatg 26100 
cgctttccaa gaaaatgact tttttgaaaa tggtatttct ttgaatgaga aagaacagag 26160 
agaaatagat agatggcttt taaacacttc attaattaaa cttttttttr ccaccatcac 26220 
ataatggcac ttagtcccct ttgggaactc atgagggttt tagtggtagt gagctgaaag 26280 
aaatatgttc caggactggc aaacatattc taaattcttt aaaattttca cctagcatct 26340 
accctaaata ttcagaccct gtgctagtta actgctattg aagaacaaag gtattatatc 26400 
tattattaag gataatagaa tggtatttga gatattggtc attgaatatg aatatgtttt 26460 
gagaaataag ttttatagga accaaaaaaa aattcttaaa ggaaccatat attactaaaa 26520 
atgcttctta ttggagaaag aaatgacaat catttattaa tgtgattttt tcacaacttt 26580 
attaagatat aatttaagta caacaaactc acataaagtg tacaatttga tcagttttaa 26640 
catatgtaga tgccatgaaa ccatcaccac aattaaggaa acaaacattt tcatcactcc 26700 
agaagtctcc tagccctttt actacccatt cctcccctgc tccatcccca gacaactacc 26760 
aatttgcttt ctgtcactat agatttgtca acctgatttt ctccaaatat acattcaaaa 26820 
atatacagtt gaatacaatt ggaaattcga attttgtgtt tttttcttta ggaacaaaga 26880 
tgtgaaattc tgtgtaatgt aataaaaaat aaattggact gtgatataaa caagttcacc 26940 
gatcttgacc tgcagcatgt agctaaagaa actggcgggt ttgtggctag agattttaca 27000 
gtacttgtgg atcgagccat acattctcga ctctctcgtc agagtatatc caccagagaa 27060 
agtatgtttt actattaaaa cctgaacttg gaatcttctt tctattgtgg agaaatgtaa 27120 
ttgtagtaag acaagaatta aatatattcc attgtagtat ttgaataagc agttatttga 27180 
gtagaaaatt agtgtttcca gctaagatga tggcatattt tgaaaattca tatagtgaat 27240 
ataactagta aaagaagttt tgtttatttt taaacagaat tagttttaac aacattggac 27300 
ttccaaaagg ctctccgcgg atttcttcct gcgtctttgc gaagtgtcaa cctgcataaa 27360 
cctagagacc tgggttggga caagattggt gggttacatg aagttaggca gatactcatg 27420 
gatactatcc agttacctgc caaggtatgt ttaaaaaaag aaaaagtgaa tacttactcc 27480 
cagaagaacc actgtattat tggctttggc tttatgtgtc agcttgccca atctccgtgt 27540 
gagtcaacaa gtgtttactg agttaccaaa taaatgtctt aacactattt taggtacttt 27600 
aacaaatttt aattttatta attaattttt tattagaatt gagacctcac tctgtcatct 27660 
aggctggagt acactcacag ctcactgcaa cctcaaactc ctgggctcaa gcaatcctcc 27720 
tgcctcagcc tccccagtag ctagaactac aggcatgaac caccatgccc ggccaactct 27780 
ttaattttct tagagacgga gtcttgctat gttgcccagg cagacagatt ttaatgtgta 27840 
tgatgcagtc tttgatgata agaaacttat aatggaaagc tgaggtgata gttacagtaa 27900 
atacattttg atgtataatt ctgtttgctt taatcattca aattgtagta aagcaagatg 27960 
aactgtctgc tgggatttga gcagaaatgg ataggaataa actaggaggt agaagagtta 28020 
tcaaggttca caggactgat gggtgaagct agatttccag acccgggatg tcagtccttg 28080 
aaaagcagac ttggcaggca tagacgaggc agatagcagg ataaaggaga caaatgtaga 28140 
ttgttcttca gaagatcaga tggtagagtc taggaggtag tgtgttttaa tcagagatct 28200 
gagaggcaaa gatcattgca tgagatcagg gacccatgca aaggagtgag aaaaaaaact 28260 
gggttaagga gcctgctgca tggcaactcc tgggaacagt ggccactggg gcctgggaca 28320 
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tgttgattgc 
agctagcagg 
tcagtacatc 
ttcagattgg 
gcatacctaa 
ttcaaaaagt 
gattatttgt 
aaatgtacac 
gttaaaagat 
agttctgatg 
cgtagttcct 
ttgctgttac 
tctttagctg 
tttgtttctc 
ctgttgtatg 
agtagaatga 
ggtaaaatta 
cattcacaat 
ctcctcttgc 
tt ctgtatat 
tcacttatgt 
tttgcatgac 
gaattgtttc 
ttctccacgg 
cttagggtaa 
cattcccact 
tttctcaatt 
taaaagttgt 
tgcttaaggc 
gcaaaccatt 
ctggggtttt 
agactaggtc 
cagatcattt 
cagtatctta 
attccaagac 
gtttagtaat 
ctctattggc 
tgggttcaag 
tgtattttta 
ctcgagtgat 
tgcccagctc 
tcgtgttttt 
ttcctgttat 
ttgtgttacc 
gggttcaagt 
gcacccggtg 
gcctcgacct 
ggcgagaacc 
tagttctctg 
gtggttgaat 
tggagatagt 
cccaatttaa 
cgaaaggttt 
cttttcccac 
agtaattgaa 
tgggactttg 
cttatgtggc 
tggagtttac 



agcccaggac 
atcatgaccc 
cagatgcagt 
agcagaggta 
taaaggagac 
tctcttgttc 
tcagcctgga 
agctctcata 
tggtttgtac 
cagttatatg 
ttgagttcat 
taaagaaaga 
ctacttagtc 
agtatccaga 
gtccgcctgg 
attttataag 
acataaatgc 
gctatgcaac 
ttatcccctg 
ttcatataaa 
aatgttttca 
tgaataatgt 
taccttttga 
atatgttttc 
ttctctaact 
agcagtgtgg 
gtgggctagt 
atgaaattga 
aatcttcatg 
cttaaaggga 
tatggttctg 
taagtttttt 
tgggtaatgc 
gctgtgtaat 
aaaggaatcg 
ttatttattt 
caggctggag 
ctattctcct 
gtagagatgg 
ctgcccgcct 
agtttagtaa 
ttgagaactg 
tttgccttag 
aggctagagt 
gattcctgcc 
aatttttgta 
cctgacctca 
accgtgcccg 
actgtattga 
attagaaatt 
gatttttcac 
ggaaagacta 
ttcagttggc 
atgttctaaa 
gatgctgatt 
tcccttctta 
agacactgtt 
attctactag 



tgttaaaacc 
cgatgctggg 
acatggagac 
gaggtgagtg 
caggatattg 
ttgagcagtg 
gactcttggg 
acttgcccca 
tttttaaatg 
cattttatat 
ttacagtttt 
tggtcgtgat 
atttctgttt 
attatttgca 
aacaggaaaa 
tgt caaggta 
agttagccat 
caccacctct 
gcaaccattc 
acaaatcatg 
tggttcatcc 
taccatactt 
ctattatgaa 
atttctcttg 
ttt caaagaa 
ggggttcctg 
ctcacatttg 
gtaatgagcc 
cattgtgaac 
gtagacaact 
ttacttttga 
tcaggtataa 
ttcacagtcc 
ttcagacatc 
tgtattattc 
gtttctgtat 
tgtagtgatg 
gcctcagcct 
ggtttcacca 
tggcctccca 
tgtataactg 
gcaatgacgg 
tttttttttt 
ggagtggcat 
tcagcctccc 
tttttagtag 
tgatccacca 
gtcttgcctt 
ggaaatgtaa 
ccttattttg 
tagagatgac 
ttctcattat 
ttttagggaa 
aatgatatat 
aaagtcatat 
caccattcac 
tctggcacaa 
tggaaagcga 



agtgtgagag 
atggggcatc 
tatatgcgt a 
ggaatattct 
cagacagtag 
gtgccttaaa 
atattttact 
tgaagcatat 
tagtactttt 
agaatgtgtt 
tagtaggaat 
taccatctga 
agacttgagc 
aacttgccca 
accttactag 
tgttgtctac 
ttcaaagtgt 
ctctaatttc 
atctgctttt 
caatatgtga 
aggtagtagc 
tgtttatcca 
taatgttgct 
ggtataaact 
ccaccaaact 
attctccaca 
gaaagct agt 
acctctctct 
agaattatac 
agaggcagga 
ctatatctca 
ggtgagtgtg 
accactggtg 
agcaatatta 
tagccttatt 
ttatttttat 
caatcttggc 
cccgagtagc 
tgttggccag 
aagttctggg 
ggttttaccc 
agaaactaaa 
tttttttttt 
gatctcggct 
gagtagctgg 
agacgggatt 
gcttcggcct 
agttatttct 
ttaaatatta 
gtcacatatc 
tttaggacct 
tgattttgct 
gattatatat 
tctttaactc 
ctctacacat 
ttattcactt 
gggattcagc 
caacaagcag 



aacatgggta 
aagcattagt 
act gcngact 
caanagaggg 
cctcatgttt 
aggtaacttg 
atctttgatt 
ccatgaaagg 
aataaaacag 
cttaattgga 
tgtattttct 
attttttttc 
tctttttcat 
tacgacaaag 
ctggggtaat 
ttatcttctt 
aaattcactg 
aaaacttttt 
tgtct ctatg 
ccttttttgt 
atgtat cagt 
cttatcagtg 
gtaaatattc 
gaggagtaga 
gtctttcaca 
tctttaccaa 
gggagcagcg 
tgtagggctt 
ataaatgctc 
gaccatactg 
ccattgcttt 
gtaattaagg 
tgtcattgtg 
gtttaacaaa 
caaacttgat 
ttctttgaga 
ttactgcaac 
tgggattaca 
gctggtcttg 
attacagacg 
agttgtaaat 
agtgccaggc 
ttctctgaga 
cactgcaacc 
gattacaggc 
ttaccatgtt 
cccaaagtgc 
tgttccctcc 
ttatgttaat 
c tgatcagta 
attcaggttt 
atatgcaggg 
tctctttttt 
ctatgaaaat 
tttttaaaat 
ggaaaaacta 
agtgaacaaa 
atagacacat 



tggaagract 


2 


8380 


acatggagat 


2 


3 4 4 0 


ttgggc~"t 


2 


3 5CC 


aactaaa: ag 


2 


8560 


ggctcacctg 


2 


8620 


agaagcagr c 


2 


8680 


gaatagattt 


2 


8740 


cactatactt 


2 


8800 


gaaaaataga 


2 


8860 


aaaaattr gt 


2 


8920 


actgttgr ac 


2 


8980 


tatacattga 


2 


9040 


attttttttt 


2 


9100 


aacaggaata 


2 


9160 


tgcacgagag 


2 


9220 


tttttatrta 


2 


9280 


gcatttag~g 


2 


9340 


cattccactc 


2 


9400 


gatttgcctt 


2 


9460 


ctggctt ctt 


2 


9520 


acttcancc 


2 


9580 


gtgaacatut 


2 


9640 


atgcacaaat 


2 


9700 


attcttgggt 


2 


9760 


ccaactgcac 


2 


9820 


caccattatg 


2 


9880 


atccatctat 


2 


9940 


attatgttct 


3 


0000 


agataaaagg 


3 


0060 


aggcaggaag 


3 


0120 


tgtcaaagtg 


3 


0180 


ggcatgctag 


3 


0240 


gtcgcagatc 


3 


0300 


gggcaattag 


3 


0360 


ttataaatca 


3 


0420 


tggagtcrca 


3 


0480 


ctctgcctcc 


3 


0540 


ggctaatrtt 


3 


0600 


aactcctgac 


3 


0660 


tgagctaccg 


3 


0720 


tactcttttg 


3 


0780 


tgttgccttg 


3 


0840 


ctgagtcttg 


3 


0900 


tctgcctcct 


30960 


gcctgccacc 


3 


1020 


ggccaggctg 


3 


1080 


tgggattaca 


3 


1140 


tctagtccta 


3 


1200 


agatattrat 


3 


1260 


gttggtcttc 


3 


1320 


tttttaagat 


3 


1380 


aaatttartt 


3 


1440 


tttttttggc 


3 


1500 


acattgtttc 


3 


1560 


ttgagataga 


3 


1620 


ttatccaata 


3 


1680 


actgcctrtt 


3 


1740 


tcagtatata 


3 


1800 



WO 99/67395 



PCT/FR99/01513 



46 

attcactgtc agatggtggt ggtaagtcct atgtaggaag aaaagcaggg taaggaggct 31860 
tggagtaact ggagtgagtc atagatggac ttgtcaggaa agggtttctg aagaggtggt 31920 
atttgggcag agatctaaat aaaatgaagc aacaagccat gagaatatcc gggggaaaat 31980 
gttctgggca gaagcatcaa gcatagaact tgtggtatga tatttattct agcacacatt 32040 
aattttaaaa atgtataaaa gacatccatt taatcatatt aaagatttcc atgattcatt 32100 
tagacttagt cagaaaccaa atttatattt tctttttaaa taattttatc tcaactctta 32160 
ttttacccaa taggggccag agttactcag caaatacatt ggagcaagtg aacaagctgt 32220 
tcgggatatt tttattaggt tggtagccta tgaatgtttt taaagtaact gactctgtta 32280 
ttatttatca atcagtgctt tttttggtct tgttttttga agaactgata tttgaaacct 32340 
gtggtttatg tgaattatta ataagctaga ggacgtggat tctctatttc atcaaataat 32400 
acaaaacatt ttagatatta aattttggaa attatttggt tttgttttac aatagaaata 32460 
ctcctcaaag tggaatcgaa gtggttattc aaagaaatct cagagtagat tcttatatga 32520 
agcaaataat tgcccctaat ttatctctaa attttgtaag ttctaaattc ttttttcccc 32580 
cagtttctaa tttatctctt ataagtcaag agtccatctg gccaatttaa tttcagtgag 32640 
tgtaactatt ttgcatatat taaaaaactg tatatgaata cagaagatgg tatttaagga 32700 
tgaaaataat tattcaaatg tgatagcatt atggggagtt ttaaaataaa agttactgtt 32760 
ttattcttcc aaaaatttta ttataaagta tacagttaag agaatataca taaaatacat 32820 
atgcagctta aggaagaata ataaaatgaa tacttcatgt attcaccacc gagtttacca 32880 
ggaaaaagca taaacaaaat aaacctcttc cacgtaattc ctgggttaaa gagaagttat 32940 
agtggaaaat atttgggagc aaacgataat gaaaatacta tccattaaaa ttgttagatg 33000 
ttgcaaaact gatttcaagg aaaatttata gtgttaaatg tttagaaaag aaaaaaggtt 33060 
agaagttaac cacttatgta tctatctcat gaaattagga aaattataga tataaactaa 33120 
aaaatatgtt aaaagggaaa taataaagat aagaatgaag tttaatgaaa cacaaaacag 33180 
agaagctcac aaagccaaga tttatttttt gaacaccgag tacaattgac aaatctctaa 33240 
caagtttgat taagaaaaaa gaaagcatga ataaacaatt ttagggataa aaagggaaac 33300 
atcgctaaag atatcccaga aatgtaaaag ataataaggg aatattatga aaatattcat 33360 
gccaatacat ttgaaaactt aggtgacata gacaaaaaca aaattgacca aaattgagca 33420 
aaaaagaaac aaaatctgag tagtcctgta acttagtaaa aattgagtta gaaaagttaa 33480 
agaagtcttt acacaaatca aacatcagac tcagttttct aggagagttt tgccaaacat 33540 
tcaagtagca gataattctg gtctattttt ggccccagaa gatatatttt acttgccatg 33600 
catttaatga gatagctgtt gatttttttc aatcaccgtg acaggtgttt tatattaggt 33660 
gttattcgcc agacatctag tccacctgtt gccagatatg gaattaatat tcacttattt 33720 
tgaattaaaa tttgttaata aattaataaa acaaagtcaa agttcaaatt attaaaaaag 33780 
taaaagaaat aaaatatatt ttatagagag cccttacaaa acagtaccaa cataatgagc 33840 
tttccaaatt ttgaatgggc aaaataaatg aataggcatt tcacaaaaga aggaagggtg 33900 
gccaataagt atatattaat ataaaaatgg ttacttgtaa taggaatcaa aagtgtttga 33960 
cttattgact aagagtcagt ttttgttttg atccctgtta gtctatccag aaggcatggg 34020 
tcttaataaa caccttgacc tcaacagttt actgaataca agggtaattt catatgcctt 34080 
gccttcttta agggtttgtt gtaaagatta aaataaatac ataaatatat ataaatacat 34140 
ttatatgtat ttatatgtaa ttacatacaa cttgccttct ttaagggttt gttgtaaaaa 34200 
ttaaaagaag tatataaata tatataaata cataaaataa atacattcat atatgtatat 34260 
gaaatcactt tgccaactat gaagcctgat tcaaatatga aatgttgttt gtttttccca 34320 
gagcacaggc tgcaaagccc tgcattcttt tctttgatga atttgaatcc attgctcctc 34380 
ggcggggtca tgataataca ggagttacag accgagtagt taaccagttg ctgactcagt 34440 
tggatggagt agaaggctta cagggtaata attataaata cagaaataga atgttataac 34500 
aaaatgtcat catgtcatca gattttggta aaaaaatgtt cttttttcct ctaggtgttt 34560 
atgtattggc tgctactagt cgccctgact tgattgaccc tgccctgctt aggcctggtc 34620 
gactagataa atgtgtatac tgtcctcctc ctgatcaggt gacaatttca tatttagagt 34680 
ccaaaaccca acaaatgcta cactctttcc ttgtgagctt tacttctgcc aggtaatggc 34740 
aattgtcctt agaagaccag ctttcttagg gaaaagcttt agccactgtt tgctcaaagc 34800 
ataaaaagat tctgaattag atgcaaagcc tttttttggc ccagtgcaag tctgaaaact 34860 
ttgtaatcct tctgtgttgg ctgattgggg aaaaaaaaat gcaagaaacc taatgtatta 34920 
tattttcaca ttatcttctg ttcaaagatt acatacttcc attatcctgt caaaaaaaaa 34980 
actctgatac agaatcaagc atgtgaatcg taagcatgta agcaggtttc atagagataa 35040 
tttttcaact cttccttgtc ctgtgttgtt ccaactctta ttctccaatt tagaagcaaa 35100 
caaataaatg aatgaaagaa cagatagaca aatgaatagt caaaggtata aagtatctgt 35160 
atatatgtta catgtagcta ttatttaaat tatttagatt ttccttttga aataccttct 35220 
tggcacactt gcctaaatct agaaaataag cactgtgtga ataagaaatt atttacactg 35280 
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aatattttgt 
ctggagtaca 
ctccccacct 
attttattat 
actccagggc 
gagccaccat 
ttctgttggg 
ttacttataa 
aatttaagat 
ggtgtcacgt 
tgaccttcag 
actttacaat 
aagttatatg 
atttccacct 
aatttacctt 
tatgaagttt 
tttgcaagga 
tagagttttt 
ttgaagctca 
tttatgacat 
tcttggccag 
aggatcattt 
acaacagagt 
atacctgtag 
aggatgcagt 
tgcccccaaa 
catcagcctt 
tgttacatta 
accacatttg 
ttttgctatt 
gtatttgtag 
ggagtagaaa 
cttagcttca 
tgtctttata 
atgagctctt 
gttattattt 
tattttagga 
ttaaccatag 
cccttgtttc 
ggctctactt 
tatcttgtgc 
tgcagtgatt 
aaaatagtct 
aagacagggc 
ttgaggtttc 
aaacttaaat 
aagaaattcc 
aagtgtactg 
ttctactagc 
tacatgtaac 
tgctttatta 
cagactagag 
tgattcttcc 
gctaattttt 
actcctgggc 
gagccactat 
ccaagaacag 
tttagaaatg 



aggtttttgg 
ctggtacgat 
cagcctcccg 
taatttttgt 
tcaagtgatc 
gcccagcctt 
gaaaaaattc 
agctttttag 
aatattttta 
cttgaaattt 
catgtagcat 
gcccaattgg 
aggaagttgt 
taaaaaatgc 
tagttgaatg 
gatgtctgtt 
tattatttaa 
tgtttgtttg 
cattgttcca 
gtcctcatca 
gtgcagtggt 
gggcctagtt 
gggatcttgt 
tcctagcttc 
gagccatgct 
aaagaaaaat 
ttctctaaag 
tagactttac 
tttggaatgt 
ttggcaagcc 
agctctctat 
agtatgaatg 
ttacagactt 
attttaatag 
tgaaaaatgc 
atttctgaga 
tggaagttcc 
cagtggctct 
tttagagatg 
tggaagctct 
agtcatcatt 
tctctcctaa 
tgtttcttgc 
tgggagcaag 
tcttacctag 
tctgttatca 
tgaaaacaaa 
ataatgtttc 
attcaacatc 
atctgtacat 
atttaggctt 
tgcagtggca 
acctcagcct 
gtatgttttg 
tcaagctatc 
gcctagccta 
taaggtggtg 
tcccagaaac 



gtttttgttt 
cacaactcac 
agtagctggg 
atagagargg 
ctcccacctc 
aagagtgttt 
caaggaagat 
atatataagg 
attttatttt 
taaatgtcct 
cagtaactga 
aggccttaca 
tatgacattt 
tattttttaa 
ttccatagtt 
tctttaacat 
attgggatac 
tactttaact 
atctggccaa 
ttcttgaatc 
tcacgcctgt 
tgagaccaaa 
ctctgtgaaa 
ttgggagagg 
tgtgccactg 
attcttggtt 
acagtattat 
catatatttt 
ctacagaacc 
attgaagttc 
aatgagaaag 
gaaagtcaga 
tcttggggga 
ttaaattttt 
ttctaagttt 
ctaaaattgt 
agctctgata 
gacgattcag 
tccgagatcc 
tatgaatcag 
atacagttct 
ccagccccac 
ttacactaat 
gaaccaaagt 
tggctttaaa 
tgaacagttg 
gtgttatctg 
aacaggaaag 
tcttctaaaa 
gtgtttggtt 
tttttttttt 
caattatggc 
cctgagtagc 
tagagacgag 
tgcgtgcctt 
actcagactt 
gtttaatttt 
ttagtataac 



ttcagacaag 
tgcagcct ct 
accacaggca 
ggt ctccctg 
aacctcccaa 
gattttcatt 
aaatagtagg 
ttaatttatg 
ttatttgtta 
cagtgactct 
ctcctttact 
tggaatgctg 
tatgagtgat 
acaactttgg 
ggaatatggg 
taccttaata 
catgaattaa 
tttaaaaaat 
taggagcccc 
acttcct cac 
aatcccagca 
tcatggttgc 
aatttaaaaa 
ctgtggcagg 
cactccagca 
tatcttgtac 
gattttaata 
ctaggaagga 
tacagtttct 
ttccctctcc 
cactctataa 
gacataaaaa 
tggttggtaa 
accatgtgcc 
cttgtattgc 
ttacatcttt 
gtgacctaag 
ctggagatgg 
ttccagatga 
aacttggaaa 
gaaatataaa 
atattcttcc 
tggtaatttg 
agcgcgtggt 
acatctttag 
aggataatga 
tgatactttt 
tgttttgatt 
attaatagtg 
atctatatgt 
ttttttttga 
tcactgcagc 
tgggactaca 
gtttcaccat 
gacctcccaa 
taaaaatata 
agtctttaat 
tttactttct 



gtctcacttt 
atggcccagg 
cacgctacca 
tgttgcccag 
agtgttggga 
cattttcct a 
ctgttggtac 
aagaaaatca 
aataaatttt 
ctacctctgg 
ggagctgatc 
ctctcgagtg 
aaaagaagta 
taaaactgta 
ttttgcagag 
ttggcaaaaa 
atactacaaa 
aatcagttaa 
ttttgtatgg 
tt ccagatac 
ctttggcagg 
acaaactgta 
ttagctgggc 
aggat cgctt 
tggatgacag 
tttctgtatc 
tttacagtag 
ttattctatt 
aaatcagaaa 
ctttactacc 
catggttgat 
taaagcccag 
attatctaca 
tcaaaaccgt 
tctaatagaa 
aaactggttg 
tctgtcttca 
agaatgtggc 
atcaaaattc 
tggaacctct 
gctatatgtt 
tggttggttg 
cattccttgt 
tgtgattacc 
gagcagttcc 
ataatttgat 
gctgcatagt 
aaatgtgggc 
gttcactgta 
ttcctggttt 
gacagtctca 
cttgacctcc 
ggcacatgcc 
attgcccagg 
agtgctagga 
aaagcaattc 
tctgttttta 
gaaaatgaag 



gtcacccagg 
ctcaagcaat 
tgcccagata 
gcttt cttga 
ttacaggcgt 
tatatattat 
atttctcaac 
taagatacac 
tctcctttca 
cagatgatgt 
tgaaagctt t 
gactccaggc 
caatgtcaaa 
tagaaacata 
aatttataat 
catgttggtg 
caaaaataat 
agttgttgtt 
ctcctgtatc 
agtaagttat 
ccaaggcagg 
cccactatgg 
atggtggcac 
gagtaaatcc 
aatgagaccc 
ccagccctag 
atatttgaac 
actcttcttt 
ctccctaggt 
agaaaggtgt 
tcatcatttt 
aggtctgagt 
cattctatct 
tagagaatta 
tgctatctat 
tccttttgtg 
atggtctttc 
ttagatcagt 
aatatgtacc 
tctgatttgg 
ggtgtaaagt 
gttcttcagt 
taagattttc 
tttggtttct 
attttatagt 
acaataatgt 
aagcacaatg 
agtatcactg 
attttattgg 
tttgtacatt 
ctctatcatc 
tgggcttagg 
accatgccca 
ctggtctcaa 
ttacaggtgt 
atttttattc 
atttattcta 
aaacctgtcc 



35340 
35400 
354 60 
35520 
35580 
35640 
35700 
35760 
35820 
35880 
35940 
36000 
36060 
36120 
36180 
36240 
36300 
36360 
36420 
36480 
36540 
36600 
36660 
36720 
36780 
36840 
36900 
36960 
37020 
37080 
37140 
37200 
37260 
37320 
37380 
37440 
37500 
37560 
37620 
37680 
37740 
37800 
37860 
37920 
37980 
38040 
38100 
38160 
38220 
38280 
38340 
38400 
38460 
38520 
38580 
38640 
38700 
38760 



WO 99/67395 



PCT/FR99/01513 



48 

ttgggcatta gtgtgttgga tttaagcaac aaagttaaaa aaacctaccc tgtgttatgg 38820 
caattttcac ttgatggtgg ttctataaca caggtatcag tgaaccttta taaaagatga 38880 
acaacttttc agcttgctta atttcagtta attaacatgt atacttatct atgttaatgt 38940 
tttattgctt aaaatgttta atttttatat ttggtaaaca gatagttttt tctctccccc 39000 
tcttccttcc atctttcatt actacaattt accatgcaga gctcacaatg tctctctgca 39060 
ccaagctcca tgactcagga tttgcctgga gttcctggga aagaccagtt gttttcacag 39120 
cctccagtgt taaggacagc ttcacaagag ggttgccaag aacttacaca agaacaaaga 39180 
gatcaactga gggcagatat cagtattatc aaaggcagat accggagcca aagtggagta 39240 
tggctttttc cccctcatta taattgttaa aacttcttaa aaattgtttc acccttttga 39300 
tatatatttc tttgacttat aaacgagcta tatttataaa caagggacca gaacacatta 39360 
actcagtcat ggttatgtgc ttccttgctt tcaatgtttc attatcttat aaggaagaga 39420 
acgtatggtc tcttgaaaaa actgacaata agaagtaaca actggactac cacatttttt 39480 
tttacatcct taatttaact cttcgtcaat ttcttttttt acttaaggag gacgaatcca 39540 
tgaaccaacc aggaccaatc aaaaccagac tggctattag tcagtcacat ttaatgactg 39600 
cacttggtca cacaagacca tccattagtg aagatgactg gaagaatttt gctgagctgt 39660 
aagtaacaga ttctgttttg gaagtacagc tactattaca agtgacatag tattacactt 39720 
aaacctttaa agttcgtgtt taaaataaaa atattttgaa tatttaaaag ctaattcaaa 39780 
aaatatgtgt cgtagctatg cattaaaaaa ccccaaaatg tcagaagtac agaagtcaaa 39840 
attgagtttt cattaaccag ttcatttgat tatatttgaa ttattcataa tggactcatt 39900 
taattttagt aactttgggc tgggtgctgt ggctcatgcc tgtaatccca gctctttggg 39960 
aggccaaggc aggtggatca cctgaggtca ggagttcgag gcaagcctaa ccaacacggg 40020 
gaaaccccat ctctactaaa aatacaaaaa ttagccaggt gtggtggcat gtgcctgtag 40080 
tcccagctac ttgggaggct gagacaggag aattgcttga acccaggagg tggaggttgc 40140 
agtgagccga gattgcacca ctgcactcca tccagcctgg gccacagagc gagactgtgt 4 0200 
ctcaaaaaaa aaaaaaaaaa atttagtaac ttcgaagaaa taagaaggaa aattaaaagt 40260 
tgaaagtgat tctaatgtat agtttataaa attttgttat aaaaatacct gttttgcctt 40320 
caaaataatt tatattaata ttttattgac ctcaagaaca tttaaataca ttcagattta 40380 
ttcatttgtg gaccacattt gttatacatt ggatttaaag gatccttgca attgagttta 40440 
tggccaccta tgcatctgag acccatggac tgggaaccat tctaggtcaa tgattcagtg 40500 
tgattcaatt taagagatgt ttattcctgg tctttagaag ctgctacctt ttgttatcta 40560 
attttgcagt actttgaagt atgtatgtat gtgtacatac gttagtgcta tgtatttatt 40620 
aaagaagaat cagaaaacag aggtaaggaa aaataaggaa acaaatttct gttaagccca 40680 
ccacctccca aagcatattt gtttatatgc ttatatatgt tttcctatta tggtaagaac 40740 
agtctgtaca tattgctata tagcagtccc cctttatcca catacatcct gaaaattgtt 40800 
ttacatttta aatgttaact actttattgt ttttaaatgt cattttatag tgtagctatg 40860 
ccacaatatc caatttttag acatttaaat tgctcccagg caatgtggta atgaacattc 40920 
ttgcagctga atatatgcac atatctaatt gtttcactag gatagaggtg gaattgtata 40980 
acagggagct cacatttttt aaggcttttg aaatgtattg ccaaattgcc tgccagatat 41040 
actgcaccat cactaacatt gtgtgttgca gtatttttct aaacttggcc cttttgattt 41100 
tagaaaaatg atatcaataa tttacatttc tttgattaaa gtgtagaagt tataattttt 41160 
catattattc attgtcattt gtattttatc ttttctaact tgtctcttca tcccctttgc 41220 
tccgttttct attggagtgc aactttattt gtaagaattc tttttaattt ctgtgactgg 41280 
aatttttttt tctagtttgt tatttcccgt tcatttctta aaatataatt gtgtttgcca 41340 
acaatccatt atcttttgtt ttgtaatggt agtatttata catattaaat tatctctttc 41400 
ttttttcaga tatgaaagct ttcaaaatcc aaagaggaga aaaaatcaaa gtggaacaat 414 60 
gtttcgacct ggacagaaag taactttagc ataaaatata cttctttttg atttggttct 41520 
gttaagtttt ttgatggctt ttccatatgt tgtaacagga aaaaaatggt gtctatgaat 41580 
ttcttcttaa tttaacaaat ttggttaatt tataaaatca cagattggta aatgctataa 41640 
ttatgtaatg atcaggattg agattaatac tgtagtataa attgggacat tataacagat 41700 
tccatatttt atttcctaaa atctaaattc agtctttaat gaaataatat tagccaaatg 41760 
gtggaactaa tttatttctt ttgaggaaaa gataataaag aatgtaatta aatttaaatt 41820 
tcttggaatt cccagttgta tattcatcac ctttgtagca tttgacaaat tttatgctta 41880 
gcagcttctt cactgttttg aaataaaata tcctattacc tactgataca attatctgtt 41940 
ctttgtatat caaaaaatgt gaaatttaca cataattcaa atacatttaa ttatccgctc 42000 
aaccagaaat gaaatcacat ccctctacta tactacatcc agctccaagc ccaagatatt 42060 
taaatgacat ccattcctct cctagttcca gttatgattt tatcttgata ttctctcata 42120 
tatgaactaa attataaagt tagccaccat caatacaatc tgcgtatcta atatcttaac 42180 
tatatagtaa tggggtaagg gaacagcaaa aaggagaaca ttaattaaaa tatacaagta 42240 
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agcctgggca 
atgcctctag 
ttcaaggttc 
atcactagta 
atgaaatcac 
gaagcaatgt 
agggtggtgg 
ccctccagga 
cctgccgtca 
gctgacaagt 
ccacattgtg 
tggggtggct 
ttagtataag 
ctttgggccc 
gttctttcca 
agatttttat 
attctgttcc 
agcagtaatg 
gtgttagtgc 
gaagaaggct 
tttctctggc 
ctatattgtg 
agaatcaagt 
caatgactgg 
aggcctctga 
gcctgaagta 
tgacattcca 
aattccttct 
cctaagagaa 
gccccacccc 
tgaaataaac 



acatagtgag 
tcccagctac 
taaaccagca 
ttaaactgag 
tgagctgaca 
ctatgggata 
tggtaaaaat 
aggacaaatt 
gacttgggct 
aggctgtcaa 
gaggccacat 
ggaaaagaca 
cactgaaggc 
attccaagaa 
aatttctggt 
atcagacatc 
cttggaagat 
ctttcactct 
atacacagtg 
tggagaaaag 
tcttcattct 
gtgactcaaa 
aggatctttg 
aggaacacca 
gcccaagcta 
accaaagaat 
ccattgtgat 
cctggctcaa 
aacccccttt 
tatctccctt 
agccttgttg 



accccatctc 
ttgggaggct 
aagctcagaa 
acacgtcacc 
tacctgccct 
gcctaacaaa 
ttggagaaca 
gctgcctgct 
gttctctcct 
tatagctggg 
ccctgcactc 
gccgattgac 
ttttaactga 
ctctgggcat 
catctggtta 
tctacctcct 
ttcctgtctc 
gatgggaagt 
tctgataatc 
aagattcatg 
tagtctgacc 
ccaggccttt 
cccatgtatt 
gggtccttgg 
agccatcctc 
cacaaaagca 
ttgttcctgc 
aacctccccc 
gattataatt 
cgctgactcc 
ctcacacaaa 



ttaaaaaaaa 
gaggtaggag 
tcccagggga 
ctgcattgca 
cttttcacca 
caatgtaaaa 
tacaaaacaa 
ctgtgataga 
gggtgtggac 
ttgtcatgtc 
ttggccaatt 
atccatacag 
gcattcacat 
acttttcctc 
tgttattagc 
gacagaatgg 
cactgtttgt 
cacagtggaa 
cccagagtgt 
gcaagaactt 
taggtgtgag 
gtttactaac 
ttggtcttaa 
tctcacgctg 
ccctgtgacc 
gtgaaaatgg 
cccatcttaa 
actgagcacc 
ttccactacc 
tttttcggac 
gcctgtttgg 



aattagccat 
gatcacttgc 
tagaaacaaa 
ctttgtttct 
taaagtgagt 
accatttagt 
atacaattcc 
agaggatcag 
ttgcctggtt 
agctgtggtg 
tgaccatgaa 
aggtcatctt 
aggacacaaa 
cagacctcat 
cactatctgt 
aggagatatg 
aagggctact 
ttctgggtct 
ctggtgccct 
gtgatgtgat 
aattaggtca 
tgggagattt 
gaacacaaat 
atttagataa 
tgcacgtata 
cctgttcctg 
ctgagcgatt 
ttgtgacccc 
cacccaaatc 
tcagcccgcc 
tggactctct 



gcatgatggt 
t cccaggagg 
gacttagtgg 
cagttctttg 
ttcatgatca 
aagttcatga 
aaggtgtgtc 
atgtaatcaa 
ggtcactgct 
agggggaagt 
tcttaagcac 
gaccacttga 
tattctgatt 
acccagttgt 
gaatcagcat 
ttacttaaca 
ccctcaatgt 
ccaagaatta 
tggatcctgt 
gacagggcct 
ggggccatga 
ttacattgta 
gatatggctc 
aacgactgtc 
catccagatg 
ccttaactga 
aaccttgtga 
cgcccctgcc 
ctataaaatg 
tgcacccagg 
tcacacggac 



42300 
42360 
42420 
42480 
42540 
42600 
42660 
42720 
42780 
42840 
42900 
42960 
43020 
43080 
43140 
43200 
43260 
43320 
43380 
43440 
43500 
43560 
43620 
43680 
43740 
43800 
43860 
43920 
43980 
44040 
44100 



<210> 64 
<211> 16869 
<212> ADN 

<213> Homo sapiens 



<400> 64 

aagctttagt 

gtttctaaag 

catagttgag 

attttctgtt 

tggaatgttt 

tcagaaggtt 

aaatagactg 

caccaaacaa 

gcctgtagac 

aaagctcctg 

ttttgtagag 

gattagtcta 

cccttcttag 

agtgggagga 

tgtagattgt 

gagccgttag 

gaggttgtcg 

aagtggagtt 

tgagaggaat 



agagatctca 
ccttagtttc 
ttgggaaatg 
acttgcattc 
atgtgtagtg 
gtcctttgtc 
ctttgccaca 
tacattttag 
acatacatac 
agtcagtttc 
ttactgaagg 
aaggtctctg 
ctgttttccc 
gaaagtgcct 
aggaattatt 
tgcgatggca 
actgtggtgt 
gagctgagta 
tccaagatgt 



aaaatggttg 
agcttgctag 
tctttgagga 
tgtcatgctc 
aagctctgag 
tcagcaattt 
acattcagaa 
tacttctcaa 
tatgaatgtg 
cactataatc 
aagagttggg 
ctactcttta 
ccataagtgg 
actgacacat 
cttaaaatgc 
ttgaagaatg 
caaatgggta 
agggcagtag 
tttgataaaa 



gatggtagca 
aaaacctatg 
gacacttttt 
aggctattag 
aggactttgc 
ttaagctaat 
aatcatttat 
attgcagaac 
ctaatgtttt 
actgcagaat 
cctagtgggt 
tttgtataag 
ctgttattaa 
gatgtgagga 
tgattgtata 
agaaggacag 
gagtaggccc 
tgaggattaa 
gaatgaggag 



aattactaag 
ttgagtatta 
cactttgtat 
agcaggtaca 
attagatctc 
agtagcagaa 
ctttttattg 
tctcataggg 
ttgtattttc 
caatcttcta 
aatgtgccac 
gtgtgattat 
aacatctcat 
tcttaagtat 
gtgtggagcc 
agacaggatt 
agagattcta 
cacctactag 
gtcaggtttc 



aactctcaaa 
tggctagttc 
tcatctgtac 
tttttataac 
agcagcataa 
attgcagtgg 
cagttcttgt 
ctgggaaaat 
atagcccatc 
caaggtaagc 
taaaatgttg 
actttttgtt 
ctagagctga 
ttttttttag 
atggaagact 
tggactagta 
aaatgccttt 
aaattcatag 
ccagggccaa 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 
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agtccatgaa 
agtcttagga 
ggcagcaacc 
tggtgtgagt 
ccttaagtat 
aggggtacac 
cacaggcaaa 
agtttagcaa 
agttcactct 
agcgaggtta 
tcatgccaga 
gctatgtgac 
ttactacctc 
caatgaatag 
ttaaggccag 
tctccatgga 
ctgccaccca 
tgcaaatgcc 
tggcaagttc 
ggagcctgag 
atggctgagt 
ggtgatgcct 
atcctctcag 
tatgtgtaca 
cactggaatc 
agtagatgtt 
gtaagcctat 
gacaaacaaa 
gaggaaggac 
accagaccca 
tccaccagga 
atttcctcaa 
agtccctgtt 
atcttaccaa 
ccattatggg 
ggatggatac 
ggtataaagt 
gtcctgttgt 
ctaggagatg 
ttttggtttg 
tggggagggt 
agagaaaaga 
agccgtttaa 
cacagaggat 
tgggtacatg 
cctaatgtga 
gtgtaccact 
ggcaggaagt 
tctgtaaaaa 
caaaatactt 
atgtgtatgt 
aaacactgat 
acctattaag 
ttctgtttcc 
caagatggaa 
aagagtgcag 
cccgcctcct 
aactctccaa 



catctgatac 
aaggaattag 
attgaaggct 
tagtacttta 
actttttttt 
tggcattcct 
catctctctt 
acagttgctg 
atgaggtgga 
attaacttgt 
gcttaagcct 
gaggaccaac 
agtgggtcaa 
taggagttat 
aagcaacttg 
agggtgtgtg 
tgtttattaa 
cagtattgta 
aagaggtcac 
tgggagccac 
ggcctccctg 
aaactagtgc 
caaatgagga 
caacacagca 
tttcactaag 
ttggattcat 
gataagcaag 
ccataaatgc 
cagctattga 
tccgtagtga 
aaaaactcct 
aagtgttttt 
tcaagggaag 
gaactatacc 
tgttcagagg 
cagagtcata 
ggaacagaaa 
ggaaggatat 
tacagtaggt 
aatttgtttt 
ggcatgtaga 
ctgctgagct 
ccttactact 
ttttagggcg 
tcattataca 
actctggtct 
ctagtggtgg 
atatgggaaa 
ataaagtcta 
tatgaacaaa 
ataattttca 
acattagact 
gttcattcat 
cccagggagt 
agccctacta 
cactgacgtg 
atatcatagg 
tattatgtaa 



ctcagtgaga 
aacatagacc 
atttggtgtt 
tacttgaccc 
aagcccacaa 
cagcagggct 
atttttccaa 
tgtatcagtg 
tactactatc 
ccaagatcac 
agagcatagt 
ctctctaatg 
atgaaatcat 
cacatcttcg 
ttgagctacg 
ggacctgtta 
atgataagga 
gtggctatca 
tgccagccac 
tggggat cac 
gagcatggca 
tgttctcgtg 
gactactcag 
catattaata 
acattgtttt 
attcattcag 
tattctcatt 
aaactattta 
tgggtaggaa 
tccagatgaa 
ggcctatcag 
atggttgagg 
cagcaatgaa 
cacttaagga 
agagattatt 
gggaggattt 
tgaatgagac 
aaaactcaac 
tgaggtaaac 
ggtttgaatt 
atgcattctt 
gatgtaggag 
gcttcatgac 
gtgaaactat 
tttgcccaac 
ttgatgatgc 
gaggggttat 
tctctctact 
ttttttaaaa 
tcttttctcc 
ttcaaacgtg 
atctcgaaca 
agctgtgatg 
atattaccaa 
tgctcaaatc 
gctcattcct 
taagtttgac 
aagagtgtgt 



gaagtgacag 
cccaaggctc 
tcgggatctg 
aggtggactg 
tctatatagt 
gggaaaaacc 
catttaatac 
gctgagcatt 
cccatttt ct 
atagccaaca 
tcctggctct 
tctcatctgt 
atgtgttaag 
tatttgtgca 
ggtttagtgt 
ttgtgactgt 
caataatgca 
cagcagtgcc 
tgagctagag 
ggccaagagt 
gtggcagaac 
tggacccctt 
atcagtgact 
aatacctact 
tactttgcat 
catacatttg 
tagaatttgg 
tatgataaat 
ctagcaagta 
acagccaccc 
gtgctatgtt 
tacacattcc 
ttacactgtt 
ggtgctggat 
tccagctcaa 
aacacaggac 
acaaagcctt 
tgggagtgga 
atatcctgaa 
catggtatct 
accaaatcag 
ctttggctgc 
tgtggctaac 
taatactctc 
cccacagaat 
tatgtcagtg 
tgataatagg 
tctgctcaat 
agtggggatg 
agatgtaaac 
aaacaacttt 
ccttttactg 
ttctattttt 
attggtgatg 
agaggtttta 
accctctcta 
aaatggcaca 
tagtcagctt 



attgttgtgt 
ggcaggcctg 
aactgtcatt 
agaaactcaa 
cgaagtctgt 
aacaacaaaa 
attgttaata 
ttgcatgctt 
agatgagaac 
agtcatggag 
acagctttag 
aaaataggaa 
cacttagcag 
ttaccttcac 
actaacagtt 
ctgtactttc 
acaaagtagt 
actggcaggc 
cccagatcag 
gtgaccaccc 
aactccatga 
ttctctacca 
tagtcctgtt 
atgtgccagg 
ttctgccttt 
aatatgctgt 
gaatattgat 
aactttggac 
gcggactgtg 
tcagacactt 
acagttcagt 
tacagcttta 
cccgtagtca 
gtcataaaga 
gacccaggga 
atgtacacat 
gaatgccaga 
agagaaaggc 
gactataatc 
attttctttg 
catgattttc 
agtctctatg 
aaagtaggga 
tttgtatgat 
acacagcacc 
tacgtt cat c 
ggaggatgtg 
tttgctgtaa 
gtattacggc 
tgtcatatat 
agaattggca 
accactttga 
attttcaatg 
ttgtttctgt 
tccaggacca 
gccccagaga 
ggtttttttt 
gggctgtcag 



ttaaaccaga 
gcacggcaca 
taggggacag 
gtgatgatgc 
tcctcccaac 
aaagtctgra 
aaatatctaa 
tatttcattc 
attgaggcac 
tgaggcagr c 
caagtgactg 
ttgtaaatag 
agtaagcact 
agtttacaga 
tccatgtgrg 
gtattgttgt 
caagtaatgt 
agcaccatgg 
gcatgcaaga 
aagacccaga 
actcagatc" 
gaaaccttga 
tggtgttata 
cactgcctac 
acactatgaa 
gttatgcata 
tatacatgtg 
tgatggctgg 
gcctgcatag 
ggataaaggg 
tactggaagt 
cctgctgcca 
aggacagtat 
tttggatcaa 
agaggacata 
tagttagttg 
aatactagta 
agcagtgagt 
caaagattat 
agtggatggr 
aagacagtac 
gctttcagca 
tagtacggag 
actataatgg 
aagagtgaac 
cgtgtaacaa 
catgtgtggg 
acctaaaacc 
aatataaaat 
gcaccctcgt 
ccaaacatat 
aaacttgctt 
tgggattatc 
gattgatgaa 
gtattgcgag 
ccaatttgat 
taacttagtt 
gacaaaatat 
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cacagactga 
ccaacatcaa 
tggtcacctt 
tcttcttata 
ccttaattgc 
caacatataa 
atgagtatta 
gtagctggag 
agtggtatgg 
ttgctcagga 
aggaaagaac 
gctacacatg 
tgtgcttttg 
ctgattaata 
tctgcagtga 
gagagaactc 
tacattacca 
tctatggatc 
tactgcctcc 
gcatggcatg 
atttaccggc 
tgtaaaatgg 
tgatacatgt 
actgtttttg 
taatttcaaa 
cccagtgtct 
aacctttccc 
ttggaatttg 
acagttccca 
ataacaatta 
aggcctggtg 
gggcaatgga 
ctaatattct 
aaaagtgact 
tggtcactta 
agcactttta 
tcaggagttc 
aaattagcca 
gagaatcgcc 
ccagcctggg 
ggcacagtgg 
tgaggttggg 
tacaaaaatt 
ggcaggagaa 
gcactccagc 
aagggataga 
cctaggcaaa 
ccattattta 
taattaaggt 
tcataaagcc 
gctttaacca 
ttcatctagg 
tggatggatc 
tctctactaa 
ctcgggaggc 
agatcgtgcc 
aaagaaaaaa 
tcttaataaa 



gtggcttaaa 
ggtgctggca 
cttgctgtgt 
aggacaccat 
ctccctaaag 
atttggaggg 
ttaagtacaa 
tgtgagtgct 
ataagatttt 
actaggttat 
tatcccagtt 
tcatcttagg 
ttaatttcaa 
caatttttaa 
gcatgcatca 
cagggacaaa 
aacaattcta 
aggatctcag 
tctttctaat 
aggt cagaac 
catgtgactt 
gaataataat 
aaacttagag 
ggagaatgcc 
gtaatgcatg 
agaaatttta 
ttggctgcct 
tttgtcatgc 
ccagaccaga 
aggaatcagt 
tggtggctca 
gtcagattct 
tagtaccaca 
aaaaagtttt 
gaaaattaaa 
gaggccgagg 
gagaccagcc 
ggtgtggtgg 
taaacccagg 
caacagagtg 
ctcacgcctt 
agttcgagac 
agccaggtgt 
ttggttgaac 
ctgggtggac 
atataatgaa 
agctgtaatt 
tttctagaaa 
atagatgact 
acacaagcct 
taagaaaaat 
ccacgtgcgg 
acttgaggtc 
atatacaaaa 
tgaggcagga 
actgcactcc 
ttttaattta 
gctgctcttt 



caacagaaag 
acacggattt 
cctcacatgg 
ttctgtcaga 
gtctcatctc 
tggcgggggg 
aaaaattaga 
atcagttatt 
tttggagtga 
ttaggttact 
atcccat act 
cctttatagt 
agctgccaaa 
agttttcaga 
ttacttttgc 
taatatacca 
gccttctgct 
cagaggcagt 
ccccagattc 
accagttctg 
tggcaagttt 
agtgcctacc 
cagtgtgggt 
atattcttta 
tttcaagggc 
acatcttatg 
tccagggcca 
accttctgag 
gaagggctac 
tgccaaccat 
cgcctgtagc 
ctttcttaaa 
agatatgtca 
tctcctgcta 
agggataggg 
caggcggatc 
tggccaacat 
catgtgcctg 
aggt ggaggt 
agactcttgt 
taatcccagc 
cagcctggcc 
ggtggcgcac 
ccaggaggcg 
agagcaagac 
atatattttg 
tccagagaga 
ctcataaaat 
gaccaagggc 
tatgttctca 
gattggtgga 
tggctcatgc 
aggagttcag 
attagttggg 
gaattgcttg 
agcctgggtg 
atccttctgt 
actgtttcta 



tcactttctc 
ctggggaggc 
cctttcatgg 
tgagggcccc 
caagtaccat 
ggatgcaatt 
gagctttata 
ttgagttaga 
cccagggtta 
tatttataca 
tgcaaattct 
ataaaggctg 
acagttgtga 
tttttacagt 
atcctgagaa 
ctgttatt ct 
tataagtata 
gatgtatcag 
tgatatgcat 
gagccagact 
cttagtctct 
tcagaaggtt 
acaaaataaa 
agccgttaaa 
taatgccagg 
aaaatgatat 
gaggaagatc 
tatttcaagt 
atatggactc 
ttgtagttca 
cccagctatt 
aaaccacaaa 
taggtatctt 
cctagtaata 
ccaggcacag 
acctgaggtc 
ggcgaaaccc 
taatcccagc 
tgtagt gage 
cteggaaaaa 
actttgggag 
agcatggtga 
acctgtagtc 
gaggttgcag 
tccgtctcaa 
aacttaaatt 
ccattaggaa 
ggattgtatt 
ttaatcaaat 
tctcaaaaat 
tgattttatt 
ctgtaatccc 
gaccagcctg 
tgttatggtg 
aactegggag 
atagagcaag 
agaaacaggc 
gtcaaaaatg 



acagttgtgg 
ttttcttcct 
agtgagagct 
acccttatgg 
cacattgggg 
cagtccataa 
gaaaatatga 
gcaatgtgca 
aactgt acta 
aacctattca 
caatatgtgt 
atagttgaaa 
gatagactca 
tacttcagac 
caagcataag 
cacctatatg 
tagaattttt 
aatcaccttc 
ccttgtccta 
gtctaggttc 
cttgcctcac 
gatgtgagga 
catgatgeaa 
gaagaaaaaa 
ttgctcccag 
atatggtcaa 
ttccaaggaa 
cacggtcatc 
atgttgggcc 
caaattaaaa 
gcaccactgc 
aaaactggat 
taaatgaaat 
aacaaatcat 
tggcttatgc 
gggaagtgga 
cgtcgctact 
tatttgggag 
caagattgea 
aaaaaaaaaa 
gctgaggcag 
aaccctgtct 
ccagctactc 
tgagcagaga 
agaaacaaac 
atattctata 
caggtagtat 
tttctataag 
aaaatgacta 
gctgtgacag 
agcccaggct 
ggcactttgg 
gecaacatga 
catgcctgta 
gtggagattg 
actgtctcaa 
attcagaacc 
agacttcgat 



aggctgaagt 
ggcatataga 
ct ttggtgta 
tttcattnaa 
attagggctt 
caaaaaaagc 
ggcattttat 
tctactaaga 
caagaatgta 
aaaataattt 
gcctctgcat 
tggcagctgc 
caagaattta 
tttttatctt 
tgtgtttttg 
tcaagtttga 
atttacctta 
gggattcctc 
cagegaggea 
acagcctgcc 
tttcctcata 
atgaaggtat 
gtgttcaatc 
tgattaagaa 
agtggtctct 
aaatgtattt 
gatggaatac 
accatttccc 
tactcctgca 
ctgggtttcc 
tctccaagct 
ttccagttct 
tcttagctgg 
tgtttattac 
ctgtaattgc 
tegectgagg 
aaaaatacaa 
gctgaggcag 
ccgctgtgct 
aaaaaggctg 
atggatcgcc 
ctactaaaaa 
gggaggctga 
tcgtgccact 
aaaaaattaa 
tgtgtatctt 
ctatttttct 
aacaaaatat 
acagcatcta 
ctttttggct 
tttaaaaact 
gaggectgag 
tgaaaccctg 
atcccagcta 
cagtaagecg 
aaaagaaaaa 
attccattga 
caaaccataa 
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gattttatac 
gcttcctgct 
cattggtagg 
acccataata 
cggttaagta 
ctcttttgtc 
tgattgtaat 
ggtgtttgag 
tcacaaaggg 
tttggattaa 
caatttaaat 
agaatttgga 
gctgaggcag 
cccgtctcta 
gctagtctac 
agtgagccga 
aaaaaaaaaa 
atcaaaaaat 
aaaaatctat 
aaataaagat 
ggccggacct 
atctttcccc 
ctccaattct 
tccagattcc 
ctacttccat 
tatttactca 
ctgattgtag 
taattcatat 
tagattgtta 
ttttaagatg 
aggaaattat 
gttttccact 
tttgctttat 
tgaagtttct 
ctggggatgt 
ggtaggaggg 
agaaggaacc 
tgcacagtaa 
agcggaaagg 
ttctgcaaac 
gcctgtaatc 
atgattgtgc 
aaaaaaaaaa 
agctactttt 
ttttccaaat 
aactggtggt 
gtagttctta 
tcattatttt 
agcttcagcc 
ttctgcaggg 
ggttcaagtt 
cgctgctgac 
agcaagctcc 
tcctagtggt 
agagaaggca 
tttgctatga 
cacataggga 
gaataaaatg 



tgcagatagt 
tgatagt etc 
ccattagcat 
agaggectgt 
agggagcaac 
ctgatttaac 
gattttgagc 
ttggaaagaa 
tatagtaaaa 
aatgtatttt 
ggggctcttt 
gtagaggccg 
gcggatcacc 
ctaaaaatac 
tegggagget 
gatcgcgcca 
aaaagatttt 
ggctaataaa 
aaattgatca 
tgaatttcac 
gatatggece 
tgtatgcccg 
accttccaaa 
catgectttt 
catcctcact 
tctttgtaac 
ggtctgagtt 
taactttggc 
cattctgggt 
agttttaaat 
cccaaaccat 
teagcegtaa 
acacatgeat 
gtcatgccca 
ttgaagaact 
tatacctcct 
caaatgaccc 
tttatttaag 
ttcacaataa 
aagaagcatc 
ccagcacttt 
caccactcca 
aaagacggaa 
ttcagcttta 
tttttacaat 
gaacaaccgc 
aacccttgaa 
cctatattca 
actcctgggc 
tgcctgtatc 
tttctttcct 
ttaaggcccc 
aacaattgtg 
tctgtttctc 
aggaactact 
atatgtagtg 
aagatagatt 
ggagaaacag 



cagcttcacc 
ttgactacca 
tgatatcttt 
tgtatatgaa 
aegtaaaatg 
cagcattttt 
tgeagcaget 
acaactatag 
ttgattgtaa 
tcaccgtgca 
aaccaaaaat 
ggcacagtgg 
tgaggtcagg 
aaaaattagc 
gaggcaggag 
ctgcactcca 
ggagtagatt 
atgaacacaa 
tctgtttata 
ccagtgtgat 
tggtctgtgt 
cccaattttt 
ggectttett 
tggaatcaat 
cctatccctt 
ttccacataa 
agatactgtt 
tgaaactttt 
tagtattaga 
agttctctta 
tccagttcct 
gtaggtgaaa 
gtgtgttgtg 
gaaaagggag 
gtgctgttta 
acacccaaga 
acaagaggtg 
cacctcttaa 
ataagagaaa 
ttttataaaa 
aagaggctga 
gcctgggtga 
attcctccag 
tacttegcag 
aagcacacac 
tggcttttag 
agggagtgaa 
catcatgatt 
caggegcatg 
atctgaattg 
gtcctccact 
aacaccaaac 
taaggtaaag 
tgatcgaatt 
gtttctcatt 
ctttgataca 
ggattatttt 
ctccctcatg 



aaagccgcag 
ttaaaacgaa 
aaaacatcta 
attgtctaga 
ggagaggagt 
caaccctggg 
ttaactctta 
gtagctacac 
ataactttct 
tttactttgg 
ggtatttaaa 
ctcacgcctg 
agttcgagac 
tgggcgtggt 
aatcgctgga 
gtctgggtga 
catcattaat 
tgtaaaacat 
aattggcaga 
ggttcccatt 
tcccagcctt 
ctggctctga 
aacaccttcg 
ctctatccta 
tggtcctggg 
cctaaccccg 
aactaaaatg 
aaattctatt 
ttgtttttaa 
acacaaataa 
ggctgtgaaa 
tcaaatgaac 
tctacatata 
aggcattttt 
cttcatacca 
aatataagee 
ggccattaat 
tggtgaccca 
aaagcagaat 
gatggaagga 
ggtggaggat 
tagaagtgag 
aattttaaca 
tattttccaa 
acacacacac 
tctatacata 
tgaccagctg 
ctaggaaaga 
cttagctctg 
gaggtttggc 
tgaaatctgt 
acagaagcaa 
tttcctttat 
ctggctgata 
ataaactgtt 
ttttttaaat 
taaagtttat 
tggctgttgg 



aggaaacatg 
tattgggagg 
ccctaaacca 
at tcaggtgc 
ggggtgtact 
aaaatttgea 
ccctttttcc 
gtacataatt 
aagtgccaat 
atgtatttat 
accaaaacag 
taatcccagc 
cagcctggtc 
ggcgtgcgcc 
actcaggagg 
eggcatgact 
aagtaacaga 
ttattaaaat 
tggttgtgta 
gcttatattt 
gtttcctcat 
gt ccttgttc 
gattctttct 
ttgtcatcac 
atgacaggga 
gttcttgett 
cttgttgata 
gtgaatagtc 
gattgtttta 
agcttaatat 
ggcttttcca 
aatagaggga 
aacattgeae 
gtggattttg 
ggtgtgtgag 
aggagaaggt 
tattgggtca 
caaggaagat 
gtagaactgt 
gcccaggcac 
cacttgagct 
accttctctc 
tgtcaacaga 
attttctcta 
gtttgtttgc 
tctagaatat 
agaaaataaa 
actt'gggagt 
tggtaaaggt 
gagggtaaga 
cttcccttcc 
cagccttaca 
agattccttt 
acagttgctg 
tagaattatt 
caaaaagtaa 
atactaaatt 
caggaagctt 



tcgagatcag 
tcatgaaagt 
tetgetatgg 
aggtctttgc 
cacttgcctc 
gaatctaagt 
acatagttat 
atctctttat 
attcaaaact 
ttcatttaaa 
tategtaett 
actttggaag 
aacatgaaac 
tataatccca 
cagagactgc 
ccatctccaa 
ttttaggaaa 
gtagactttt 
ccatctttta 
ctcctgctga 
taccactaaa 
atactgttct 
ttgagaactt 
atttaagttt 
tgctgtgttt 
atgggagatg 
ttttagttat 
aagtaaaatt 
aacaagatgt 
gagtatttga 
ggcctaataa 
aatgtattta 
aegcttagaa 
tctggctgcc 
ccataccttt 
ctgtgccaag 
gatgeataaa 
tgctcgtagt 
atgatagcaa 
agtagctcat 
gcagtgaccc 
aaaaaaaaaa 
ggttttctgc 
acaagcagta 
ataagtgece 
tttataaata 
gtcagtgatt 
gacttccttc 
caccagcttc 
gactgatgta 
agactgectg 
cagagtgttc 
tetatatege 
agactctgaa 
tggecatett 
tgaaagagat 
gaaaagcaaa 
ccattcctct 
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ctgtgggcct 
gttgcaccca 
ccagcacttc 
aggaccacac 
cagagggaca 
aatatgtatc 
taagaatcca 
gttaacagta 
atgaattttg 
taatttttaa 
tacataatga 
tacatatgca 
tcattttaat 
cttacgtagt 
tctaaatggt 
aagccctggc 
ttctacgagg 
agaacagacc 
cacagccagg 
ctcagcatcc 
ttttgttgca 
gaatggatga 
atgaaattct 
aaacttaaaa 
caaattatgt 
gtgggtacaa 
gtagtcaaca 
ctgggctggc 
ggatcatgag 
taaaaaataa 
ccagctactc 
gagctgagat 
aaaaaaaaaa 
gggaggccaa 
ggcgaaaccc 
tagtcccagc 
gcagtgagtt 
caaaaaaaag 
tagatatata 
gaggaggatg 
aaaaatacgt 
aacaaggcta 
ggactgtgag 
gaactcagga 
aatttaatgc 
ttgtgggttt 
agaacacatt 
aatatccgaa 
ggaaagggcc 
cttgcagggg 
cagcaaaggc 
cccctgggca 
aataatgcca 
taggcaaata 
tcatagattg 
tctttgtaga 
aaaaatgagg 
acgtaggatc 



ccacaggttt 
agatggaagc 
tgccatatgc 
aagggcgtga 
ccctatccag 
tataatctta 
tgctaagagg 
tttaaagttg 
atatttttct 
taacgcaaaa 
ttctgatttt 
tataaagaaa 
attctttatg 
caggaaaaaa 
gttacaggct 
ccccaaggca 
tcatgagggt 
aaagccttcc 
aagagagctc 
agaactgtga 
gcagcccaag 
tcaaaacgtg 
gatacatgct 
ggacaaatat 
catagataca 
attttcggtt 
tgatgaatgt 
gcagtggctc 
gtcaggagat 
aaacaaataa 
gggaggctga 
cgcgccactg 
aaaggttgat 
ggcaggcaga 
catctctatt 
tgctgggagg 
gagattgcgc 
gttaaaattg 
ggagataaag 
aattaaggaa 
gggcaaagat 
ggtggagatt 
ccatctcctg 
gacgtgcaat 
ttttatggga 
ctggcctgtg 
caggcctacc 
gcctagaaat 
ttgggaatta 
aatcactgaa 
atcgtttttc 
cagaggttag 
tagaggagct 
aaatttgatt 
atagtggctt 
tgtacggatt 
cctaaagaag 
cgaaagaaat 



gctcacagca 
caccatcttt 
tgttgggtca 
attccaaggg 
ctggtggcca 
aaagtattaa 
atttaaaatg 
tgaaaaacca 
aatagaattt 
aaaagtttat 
gtaaaaaaaa 
actggaacaa 
cttttaaaaa 
atacaacttt 
gaatgtgtgc 
atggtattag 
ggagcccgca 
tttctctcct 
tcaccagaac 
gaaatgaatg 
ctgacagaga 
gtgaggtcgt 
ataatgatga 
tgtataattc 
gaacattaga 
tggagtgatt 
acttaatgac 
atggctgtaa 
tgagaccatt 
aaaaaaaatt 
ggcaggagaa 
cactccagcc 
acctgggtgc 
tcagttgagg 
aaaaatacaa 
atgaggccta 
cactgcactc 
taagttttgt 
tcaacagaat 
gacattgagt 
cctacttgat 
tgcatgtgat 
gacttgaata 
gcagtaacaa 
caaactgtta 
ggccagcctc 
acagtcaagg 
aataatcatc 
agaagaatgg 
atggggacag 
agagcaagct 
gcaagggagt 
tccaaagagt 
ttgtgaataa 
gtgatccaga 
tagagaccat 
ttaagaaaat 
tgggtaaatg 



aatggtccgt 
tctataacct 
cacagaccaa 
cagagaccac 
atgtaaatta 
aagtacttct 
tggaccaaaa 
gaaacaatct 
tatgctgtca 
aaaatgttta 
aaaacaaaaa 
acaaaataac 
ttttgaagtt 
aaaatagata 
ctgatcccca 
gggagtaggg 
tagtggaatt 
cactatgtaa 
ccaaatctgc 
tgtgttgttt 
tagaaacaac 
gcagtgggat 
accttgaaaa 
cacttatatg 
ggttaccagg 
ttgaaaaaat 
actaaattgt 
atcccagaac 
ctggctaaca 
agccgggcat 
tggtgtgacc 
tgggcaacag 
ggtggctcat 
tcaagagtta 
aaattagtcg 
ggaattgctt 
cagcctgggg 
tatgcatatt 
ttaataacca 
acaacttttt 
tcttataatt 
gtgaggtgtg 
tccattagat 
aactctgcac 
ggcaggtggg 
agtgctcact 
ctccctttct 
tgtccttgtg 
aaaaactggt 
gccataaaag 
agagaatcct 
gtcccagcat 
tcatttcagg 
agcttgtttc 
taaagaaaac 
ctaatctaac 
accatggaaa 
ctactgtgag 



gacagaaaga 
aatctgaaag 
ctctggtaca 
tagggaccac 
acatagcttt 
tgatccagta 
aatgggtata 
aaaggtccaa 
tcagaaatac 
gtgtaaaacc 
cacacacata 
aagcatagtt 
tgtattacta 
tttaggtcca 
tgccccaagt 
cctttgggag 
agtgtccttt 
gaagacagcc 
tagcaccttg 
aaaccactca 
acaaggaccc 
attattcagc 
catgttaatg 
agttagttac 
gttgtgggaa 
tctggaaatg 
acacttaaaa 
tttgggaggc 
tggtgaaacc 
ggtggcaggc 
tgggagtcgg 
agccagattc 
gcctgtaatt 
aggaccagcc 
agtgtggtgg 
gaacccagga 
gacagagcga 
ttaccataat 
gttgtaaata 
ggtaggtgaa 
taaaaatctc 
tgttctgttt 
aattgaaaat 
ctagttgatt 
caagatggac 
ctgaggtcat 
caactctagt 
tcttgcatta 
ctaactgctg 
gacaaccaga 
gccagcgtcc 
gttgatgccc 
ttttgtaagc 
ttcaactcca 
aatttttcaa 
tccctcattc 
tgtcactgct 
aaatacagta 



cgcaagggca 
aagggacata 
gtgtgaacac 
ctcagaggca 
ttagaatagc 
atttcatttc 
aaaagaagtt 
caataggaaa 
catttacaaa 
tggacacaac 
tacacatgca 
ggaattacag 
gcatccacta 
aagatggtaa 
tcatatgtta 
gtaatcagat 
taggaagagg 
agaaggtggc 
ctcttgggtt 
ggctacggta 
atcagcagac 
cgtagaagga 
gaaataagcc 
ctagaatagg 
gaggggtatt 
ggtagtgaca 
atggttaata 
caagacaggc 
ctgtctctac 
acctgtagtc 
agcttgcagt 
cgtctcaaaa 
tcagcacttt 
tggccaacgt 
tgggtgcctg 
ggcagaggtt 
gacttagtct 
ctttaaaaaa 
gagactgagt 
aaactcttaa 
ccagttagta 
tgtaatgtga 
acggatttga 
tctgtctcct 
agccatattt 
gtccaaactt 
cctctgcaca 
tgaaagccta 
catgcttcag 
agagtggctt 
tcaggcaggg 
tgagcatcag 
cgaacatttc 
gtgcagattc 
agattcatat 
tacagatagg 
gaactgccat 
ctaggtccaa 



11640 
11700 
11760 
11820 
11880 
11940 
12000 
12060 
12120 
12180 
12240 
12300 
12360 
12420 
12480 
12540 
12600 
12660 
12720 
12780 
12840 
12900 
12960 
13020 
13080 
13140 
13200 
13260 
13320 
13380 
13440 
13500 
13560 
13620 
13680 
13740 
13800 
13860 
13920 
13980 
14040 
14100 
14160 
14220 
14280 
14340 
14400 
14460 
14520 
14580 
14640 
14700 
14760 
14820 
14880 
14940 
15000 
15060 
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agaatctaat 
aacttacata 
gtggctcatg 
caggagtttg 
aattagctgg 
agaattactt 
tagcctggat 
aacctgtgtt 
aaaaagctac 
caggttgggg 
ctcgtctcta 
gttactcagg 
gagccaagat 
aaaaagaaaa 
ctgattagaa 
ttctccccat 
aacaggttct 
gcctccacct 
cagttgtgca 
ttaggctagt 
ttgtgattac 
tgctgttggg 
atgaaggcag 
gcacatcaca 
acagccaagc 
gagaacttga 
gaccacttgt 
ttacttttat 
actggaagat 
ttcctaggtc 
tgtatttca 



acaaattaaa 
gtttcatttt 
cctgtaatcc 
agaccagcct 
ctgtggtggc 
gaatctggga 
gacaagaggg 
gtttattaaa 
aatctgccag 
gatcacctga 
ctaaaaatac 
aggctgaggc 
cgcaccgttg 
aagaaaagct 
gagtggaagt 
gaatagtgaa 
tgcactgtca 
cccaggctca 
ctaccatgcc 
tctcaaactc 
aggcataagc 
gaaatataat 
tagagaaaga 
ggcactttgc 
aggtacagcc 
cagcaccact 
gttatctaag 
agcttggtgc 
aggtatgcta 
ataaagctga 



aatctaaatg 
ctttcttttc 
tggcactttg 
ggccaacatg 
cgctgcctgt 
ggtggaggtt 
aaactccatc 
catgacagac 
gcatggtggc 
ggcctggagt 
aaaaattagc 
aggagaat ca 
tactccagtc 
acaaccttaa 
ggggaggttt 
ggtgtgagtg 
cccgggctgg 
agtgatcctc 
cagctatttt 
ctggcctcaa 
caccacaccc 
ttaaaaaaca 
taagctttat 
taagagat ca 
cattacatgt 
ggtcacacag 
atatcaactt 
aaggtactca 
tctggtaatg 
caaaaggctg 



ttatttctaa 
tgttgaagaa 
agaggccgag 
gtgaaacccc 
aatcccagct 
gcagtgagcc 
tcaaaaaaaa 
tggcatgaag 
tcatgcctgt 
tcaagactag 
ccggcgtggt 
cttgaacctg 
tgggccgaca 
tctcaact tc 
attacaaaaa 
aaaaagacag 
agtgcactgt 
ctacctcagc 
tttttaagag 
gcagtcctcc 
agccagcagt 
aaatcttctc 
tattgaataa 
caaagacaga 
atgttttcga 
ttcattctaa 
ttcgggggtg 
ttaagattag 
tttacatttc 
attcagtttt 



agcatccctg 
gaggcaat t g 
gcgggtggat 
atctctact a 
actccagagg 
aagatcacgc 
aaagaaaaaa 
taattaccaa 
aatcccccac 
cctggtcaac 
ggcacat ccc 
ggcagtgggg 
gagtgagact 
tcataacat c 
gactgttata 
caattttatt 
tgtgatcact 
ctcctgagta 
atggggtctc 
gaccttggcc 
tttagaar aa 
tcaacccaga 
aaattaaatg 
aggaaat ttc 
gataaatagt 
ctttacctga 
ggggagtgtg 
gctgttaccc 
ccagatcctt 
taaatatata 



cacatggctg 
gctgggtgca 
cacctgaggt 
aaaatacaaa 
ctgaggcagg 
cattgcactc 
agcaatcact 
actgtaaaca 
cttgggaggc 
atggtgaaac 
tgtaatccca 
aggttgcagt 
cggtctcaaa 
atctctactt 
ccttacacac 
ttttttttga 
gctcactgca 
gctgggacca 
actatattgc 
tcccaaaggg 
agggtgaagg 
aatcctctcc 
agaatgtgat 
accattttgt 
cctcaactaa 
taattgatgt 
gaaacaggag 
tcccacagaa 
gagaaagaca 
tatctgtata 



15120 
15180 
15240 
15300 
15360 
15420 
15480 
15540 
15600 
15660 
15720 
15780 
15840 
15900 
15960 
16020 
16080 
16140 
16200 
16260 
16320 
16380 
16440 
16500 
16560 
16620 
16680 
16740 
16800 
16860 
16869 



<210> 65 
<211> 15000 
<212> ADN 

<213> Homo sapiens 



<400> 65 

gatctcttga 

gcctgagtga 

agggcctttg 

gaacaaagtt 

aacacacaca 

ggttccttag 

tattttattc 

ctaggaacag 

ttctaaaaga 

gatcccgtat 

ttatgatctc 

gcatcattaa 

acagtccaat 

cctgtgtttt 

acacgttttg 

aacaggaaat 

gaaaaaatgg 

tggggctcac 

atgaaaccga 



tcccaggagg 
tagtgggaga 
accactcttg 
acttgaaaga 
cacacacaaa 
gctgttatgg 
ccctcaagca 
gctgaaatgg 
gaatggttat 
taccagacaa 
agactttaaa 
tgtctgttta 
ttatttaatt 
ttcctgttta 
gacccctaat 
atttttggag 
agctaaaaga 
ccataagtat 
tgaaatgtct 



tcaaggctgc 
ccttgtcttt 
agtagaagac 
tctcttatta 
cctcatctgg 
aacaaccaaa 
cactatgctt 
tctaatcttg 
attcgctgtt 
taatccccta 
agatggtctc 
cttatcaaaa 
gaaaagattg 
ggttattgga 
aggtgaaatc 
ggtaagtaag 
gctgggtggc 
ccagcatccc 
ggcctgtagg 



aatgagctaa 
aaaacacaca 
tcgagaagaa 
aagagaatgt 
aatgaaaaaa 
gaacattatt 
atggtttgag 
accatctaat 
ctagcataaa 
gactgtttta 
cccctatggt 
ttttatcatt 
gttaacattt 
gtgatgagta 
tacaccaatg 
ggaaatttct 
tcacctttct 
catggacaca 
tggttagtga 



gatcaagcca 
cacacacaca 
caaagtagaa 
acaagctatg 
acataatgca 
ttggtttctg 
ggagaatgag 
tctgcagtgt 
aagtaatgat 
atgcttggtt 
gaagcttgtt 
gttagttgta 
tatagtcaaa 
aagaatacat 
acacagttcc 
tcagacccat 
catcctgtgc 
gggaattctg 
tggagatacg 



ctgcattcca 
cacacacacg 
ggccagagaa 
aaaaaaaaaa 
tttggtttct 
aggtcagaac 
aaataggaaa 
cttattctca 
aaaaataaaa 
gagtatttgc 
aattatgtag 
ttactacttg 
gtaattgttt 
accaaagggc 
taagaacgcc 
taaatgttag 
tgagaaatgc 
aacaaatgtg 
ggctatatgt 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 
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gaatcttgat ttttgcaatt cattagagct ttgtaatgaa aggaaacagt ttgttgcttg 1200 
ctttaaggat aggttcattt gcatttctcc gcaaggaagt agtaatgagt taccaagcc: 1260 
tagatttcac ccctttttga tttcttgctg acttaacttt aattgaatgg aagagttatc 1320 
acaaatgaat tatctttttg gttttttttt ttttgagatg gagtctcaci ctgtcaccag 1380 
gctggagtgc aatggcatga tctcggctca ctgcaacctc cgcctcccag gttcaagcaa 1440 
ttgtccrgcc tcagcctccc gagtagctgg gactaaggtg cgcgccacca tgcccagtta 1500 
atttttgtat ttttagtaga gacggggttc cactatgttg gccatgatgg tctcgatctc 1560 
tggacctcgt gatccgccca ccttggcctc ccaaagtgct ggaattacag gcaagagcca 1620 
ccgcgcccag ccaggaatga caaatgaatt accttataag taaatgccan taaggaagga 1680 
tagctggaag atgggttgag gggaatggag gaccacagaa ctagtcctat ttaaatacat 174 0 
gtgcatggta aaatgattcc atttgacaat aggttaatta tctcatagca taaggaaaat 1800 
gcttaacagt catatgcaag atgataagct ttcctatagc atccaaccaa aagatctagc 1860 
cagtacaatt tcctttgcta tattagggtt agaaaggccc ccagaggtga accaattaga 1920 
tggaatcctt gaataaaaca ctggattagc agtgaacaga aaaaagtcag attgctttcc 1980 
ttcttcccat agatgtctca gggatattta gtttcctcag aagataaaga atttagtaag 2040 
cgtttttttg tgcatactta catgaaatgt acattatttg aattctttaa aaagaaacag 2100 
ctgcatgata acaaaaattg tgttatgctt gctttagctg gtatttttgc ctagaacgat 2160 
tatatcgttc ggacaagaag ctattcctaa gaaacaatat ttttaatcca ggaagttttt 2220 
catttttaga aatttatctt actatttccc aagcaaaaga gggtagttac agattcacta 2280 
agaatcatgt gctcacaatt tttatttaat aattattcct ccttaaaara tattaatcac 2340 
ctgacttaca atggtggaac catgagtgca tttttgcctt tattgtcaat aacgtcttct 2400 
cagaagtgag ccacaaaggt gcatagttct tggagttaaa ggtctgaatt aagacaatcc 2460 
agcataagtc tcattaatgt gtgattattt tgagaaaagg caagaagtac ctaagaatct 2520 
ccccctcact gtccagttcc ctgtttcatt taaagattca ctgtaagtaa ctgaaaggct 2580 
ttccttggga ggatttattt gaatcagtct ttcacatgca aaggatattg tagaacatct 2640 
cgtttttgct ggcaggaata tgaacatctg ttgtgaggaa agaaaaagtt tcatgcaaat 2700 
tacactgcca aagaagggat gttcaagttg agaaaccagt gacatttctt gtaactgtac 2760 
tatgaatcag cgcattttaa tcttctagat aatatatgga agtgcaggaa ggtggtagga 2820 
aacggtgttc attttacata tgcgttattt tattctgtgt gagtgacttc atggcaccga 2880 
cattgctgtt tttaaatgag gatacagtaa attgcagtcc gaggaaggct aactggaatc 2940 
aacatacccg tagctttaga aagcagtttc cgcaccagcg aagagtacaa gagcgatgga 3000 
accccatgtt cctggaagtt tgcacatcag agtaaacaaa cttgaaaacc cctcttgata 3060 
gcagaattca cccagccttg ttccattttc tcttaacaaa acacaccgca aaagctctca 3120 
caagctgctt tgatgaagcc acatgtattt cccccttcac aatttacagg aagttactct 3180 
taaaagaaag tgattctggt gtttaccgcc tgtgttaaag ggacagagtt cctttttatt 3240 
tctgataacg tttgagcgaa atacagaaac tatctgtaga ctagcatagt cggtacgtga 3300 
gtaaggaaaa gcaataacct gctgtccggt gagcacaaaa ttcctgctac gaacagtgcc 3360 
ttactgctgc ttggagactg caagtcgcag atcacactag gtattgactg attgtataag 3420 
gaaatttctt aaagtctaaa gtaaaggtgg tacctcctaa aaagagggga agagagaaaa 3480 
ctttgtgtgg aaggataagg agtgtgttta tagtttcagt aagagtgtac gttttaattt 3540 
ttcttcttcc tctgcctctt tgccaagtag cctgagtgca tctgttatcc agaagtagta 3600 
ttactctagg acaaacttca aattcttcat tctgcgttgc ctttaaggaa caacatactt 3660 
tcttcctgtt ctttttccaa aaacacacgc ctatggctct gtgtgtggtg ttttagccag 3720 
cctcctccca gataaggggt tcccttccct cctttgcatt gaaaggaaag tgcaagtctg 3780 
gacatgttta tcaagaggaa aagtgacttc tcagtaatag actgtcaaat tcgggctgct 3840 
gcccgagtgt tcgctttgtt atggcaggtg aagttcacct ttgccccacc cagtgtttcc 3900 
acaaaaaggc aaggttccaa gtattcatat gaacaagtgt tactttagga cttggagggt 3960 
tgggggtgga ggatgtttgc atagttgaag ccttgggcgg gggtgtagga aacggcgagt 4020 
acagaggcca tagaaaaagc taagactcag tttgacgtcg tcagccggct tggtcttcta 4080 
cccagtgact caaagcacta aaagtcagca taatcggaac tgaagtcagt agcatcgccc 414 0 
atttgccatt cactgcagta gcaaaagtag tactctgtgg tgggttaatc ggtttgaggc 4200 
agctccttaa atgaacattt gtgtttcatt tttctgttat tttcccgaac atgaaaagac 4260 
gataaaactg aaatggaaaa ggtaactgac aaaagtgtgc cttacctgtt tccgccctga 4320 
tttctgctga ttcaagacta ttctggctaa actgattgga ttctttttct aactaggcag 4380 
taggggatca gaaatcacac acggtaccgg ctgtgtttat tctgagaggn gctggggagc 4440 
tttgggtctg acttcctttt acatgcctgt cttctctttt ggacagatct attccagagg 4500 
ggagcttcac cacttcattg acggctttaa tgaagagaaa agcaactgga tgcgctatgt 4560 
gaatccagca cactctcccc gggagcaaaa cctggctgcg tgtcagaacg ggatgaacat 4620 
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ctacttctac accattaagc ccatccctgc 
ggacttrgca gaaaggcttc actaccctta 
taagtggatt acagaacaaa aaaataaaaa 
actaataaca tgttgtttaa ttatacggct 
aagctaggga ctaggaagag gaaaaacatt 
tgatcattta aaagtatata tatatatgag 
tacaggaaga aatatatgtc caattctaat 
gattggtcca gacatgctgc gtatgcaagg 
gcttagactg catcaaaata tttatagatg 
tggaacattg taagatcatt gctagaaaaa 
gtgaataacc gtaaagattt tacatcttag 
atctctrgat cagtattata gtagccacct 
ttaggtrtat gtgcttttac ttcttttatt 
gcagagggct gcatcatttt ggccattctc 
ccataagatt ctaacctctg ctgtaactat 
cttattagca gttttaaaaa ttattccttt 
tttttgtaac ttttggtttt gatatcattt 
caaagaattt ccacttaccc tttacccagg 
gctttaccag aaggctaact tgttttagtt 
aatatcaatg ttaacataaa ttggaatttt 
aagtac~tac cctagtcata tataatccaa 
ttcattttac ttgatctccc ttaagattgc 
tggggctata aaagcatcag gacctccccc 
cacaacaggt tacccttgag cttcaggaaa 
ttaatgggtc taattaggtc ctgaccaaaa 
cagcgctccc cgagactctg gagactctgt 
cattcggctg ttgtggcatc tgtgtatgcc 
gacaaatgca caggcacagt ggcatttttg 
aagaagcgca cagctccctc ctggctttct 
ctccttacat tccttgagtt taatcattca 
cttttcttta aacagttcat ttgaggtgac 
gaaacttttt tgcatgcttc ccgcaccctg 
gcgtttttat tcctcaaaga aaggttttgc 
ttgtgttcag aagcaactgt catatatact 
tatttatgca gtatgtcccc ttttattttg 
ttttcaagca catttcattg tccaatattc 
g-tcacattaa aacaagattc ctgctgccag 
ctgatgattg agactgtgat caggaaaatt 
ttgtgtctcc aaatgaactg tgttgggttt 
agaatctcca tgagggctta aatggcagtg 
gggatttgaa acaaaccaaa ggaaagaaaa 
tttctaaaaa caaaggaaaa ggaataaaag 
caaatttggc agggggggag gtattttttt 
cagttgacca aattatagac ttctaaatgt 
agactttgtt ttgcctactg cagaacttct 
ttatagatcg aaaatgtgag tcggcataat 
actcttgaaa tgactccgtc cgcctacagc 
tgattttctt tttcatgtta actcaagctg 
agctccactg attactcagc tgctgaagga 
tggacttcct aatttccacc tgtagagcat 
ttcttttaga ataagatgca aatctatttt 
ttgtgagttt actatatact aggcactgtg 
ctggcttttt tgttggccca atcataagtt 
aggtacttaa gaagaatccc tggctaaatg 
tttatgctta ttgcacattt atgctattat 
tggaagccac tggaaaaaat atgagactta 
gtcatgaggg taaagttttt tgtatttcca 
cattatgaat ttgaccctat atagatgttt 
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caaccaggaa cttcttgtgt ggratrgtcg 4680 
tcccggagag ctgacaatga tgaatcrcag 4740 
atgccagtaa tgtcggttcr gccccmrga 4300 
ttgtcatgtg ttggatgaag taggtggctt 4860 
ttttgagtcc ctattaacta ttaggaaac" 4920 
gagctacctt gagttttgaa ttcagga~g~ 4980 
rtatccaaaa gcagrrggga gaattacagg 5040 
tatagccctc atctgtggta ctttggcagg 5100 
tacatttgag tgtacagtta ggatctgatg 5160 
ctttgtcata atttttcaat attattctaa 5220 
cttccttcct tacagraaaa aaactatctg 5280 
atcactttat cttaacaaat tctcaartcc 5340 
tgattaaaat tgctgtcatg acctctctct 5400 
aagtgatctc tttgagcaat ttaagaattg 5460 
ggttgtgtgt tcttggttag accactaaat 5520 
tggtttagaa gttaagacta aatgctgaag 5580 
caaacttaag aaaacatttg aagaaaagga 5640 
tttaccagtt attgataagt at ate cat tt 5700 
ctcattttca cctttgagac atttggaata 5760 
gactttgatt ttaggaccaa tgaacaagee 5820 
ctgtatggtt atttggtatt cattccacac 5880 
aagattgtgt ttgcagtttt tctgaaaatc 5940 
gtaggggagg tcgtgtgttt ggggtcctta 6000 
agaactggct ctcagttccc cagttccagc 6060 
aggtggcagt tcttttccct catgtctctt 6120 
catatcccta gggctgagee tcccaggaac 6180 
atgcccagtg ctgaggacct agtaacaaac 6240 
tggaactcgt attccagctg tgcgtctcag 6300 
taacatagtg agccacttcc acttaagggt 6360 
tggattcaga ggaaagtctt ttgatttttg 6420 
ctaccccagt gaetttgeae caaccaccaa 6480 
tgccaatcaa gggaagggtt taaaggcctg 6540 
acagtatttt aaggttcaag tgcttctact 6600 
gtgaaatgac accttttatt tatccctttt 6660 
gcagaatttt ttctaaatgg tggtttaaca 6720 
atagtaaaga atgagagtta acaataacca 6780 
ttgtgaaacc ggttgtctta ggcgtggcag 6840 
tccactattt catcaggcct aataggtaga 6900 
ecatgettaa agcacaatag aggtggtgca 6960 
atggttcagg eggtagagtt tggagaagaa 7020 
gtaagtagee agaaatcaca aaatggcatt 7080 
aactaataag tttgaaaccc ctacccctcc 7140 
tctatctatc taactaaccc atctagaaaa 7200 
taatctgett tctcagtttc agttgaaaag 7260 
aggttctttc ttatagtctt ggggttctta 7320 
taagecatte ggagtcttca gaagcagttc 7380 
catttaagat ttcagaacaa aaacagatct 7440 
ttgctgagtg ggagagtcag aaatgacacc 7500 
tgatttttta aaatgeaect ttactgtata 7560 
cttagggagg ctaacatgtc actctggatg 7620 
tctgaaggca ttagagatag caaacattta 7680 
ctaagtgttt tgcatagaaa gtttaaaatt 7740 
tcatatcagt tcaacattca aattatatta 7800 
tgaggggcag tgecacagat ggactgaaac 7860 
tatttgttga attatagaac caagggagtg 7920 
gatacataat ttgagtaaaa atggctcaaa 7980 
ttttattcga gcggcatcgt ttttaaaaat 8040 
ccaaataatt ctttttcacc ttcataaaat 8100 
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tccttcctgt 
tcctttacca 
cctcactgaa 
agaaatccct 
tagcgttctt 
gctggcagga 
gtcagcctag 
gacctatcag 
tagacgatga 
gaaggcatct 
ggcttgagtg 
tggtttccag 
ttcctgaagg 
ctagaactgt 
gtctttggga 
ttgaactggc 
ctccaggggc 
taggctgtct 
cagtttgaac 
ctgtgtatta 
tcctttaggt 
cccagtattt 
agagttttgc 
ctccacctcc 
ggtgtgcgcc 
ttggtcaggc 
gtgctgggat 
acagcaattt 
ttgttctgtc 
tgagtgagtg 
ttgtgtcgcc 
cttcagttct 
agagcagtct 
agagagagta 
acctctaccg 
gacgtgggag 
tgccagaaga 
ctcgctcccc 
aaagcctcaa 
ccggctctca 
gtttgggctc 
cgtacaacgc 
tgagcgctgt 
ctgtctacag 
ctctcccgag 
gggaggtgct 
tgaaggacaa 
cagaacatgt 
aagccatgaa 
cgctgaagaa 
gccagctctc 
atgcttgtgt 
gagcccccgg 
ttgactttgg 
gggtttggac 
gaaaaacacc 
cttaagatat 
cttgagagca 



ggctgtgaga 
ttttagcttt 
agaccgatat 
ctccctcagc 
ctctgtgttt 
gataacattc 
agaatacatt 
atagcaagtg 
aggatatttg 
ccacacattg 
actgtcct cc 
gcaaggctga 
catcatttat 
cctcattgct 
ataagtgctt 
tcaggaagta 
cagcactgct 
gcacatcgcg 
agggctttat 
cttgaaatga 
aaaccatgaa 
ttccactcca 
tcttgttgcc 
cagattcaag 
accacgccca 
tggtctcgaa 
tacaggcaag 
tctatcataa 
tgtgctgcca 
gcccagagcc 
agctgttact 
ctctagccct 
aaagcaaccg 
cagcgtgaaa 
ttctaacatt 
ccccgaaatg 
ctttttgaaa 
cattccatcc 
gagctccagc 
agagcaccgg 
ctaccctggc 
tcactacccc 
gagcagcatg 
caatctcctc 
ctcgctgccc 
tgtcccggcg 
ggcctgtagc 
ggtgcagccc 
tctcattaaa 
gcagaacggc 
caatctgaag 
ttgtatttag 
ttggggatag 
acaagtgact 
tagaagatta 
attctgaaaa 
ttgcatcaac 
gagctaacac 



tgccttgcct 
aaaaaacaaa 
tggcctgata 
aagctttcca 
attctggggc 
tctaaggggc 
taaagggttc 
tggagttctt 
cacaaaggct 
acagccaatg 
aataat caga 
gcagggaatt 
tgtgtagcga 
gctgttccta 
tcctcttagc 
cctattgtgg 
gggatcctgg 
aggaaggtgg 
caaattcgta 
gtcttaatct 
catcagaaag 
ttaaaatgga 
cagtctggag 
cgattcttct 
gctaattttg 
cttccgacct 
agccactgca 
ggtctgtact 
ttgtccgcat 
ttctagaatg 
caggttttct 
ctgtgtaatc 
agcactgaga 
gaaatcctaa 
tcacccctca 
cccttctacc 
gcttccctgg 
tccaccactc 
cct cacagca 
gactcctacg 
tacgcacccc 
aagttcctct 
aatggcatca 
ggtgggggca 
tcagatggag 
ccccacagtg 
cccacaagcg 
aaagctacct 
aacaaaagaa 
aagatcaagt 
gtaggccttg 
cttgctttcc 
tgggtatgga 
tcccttctcc 
ggtgaaactc 
catgaagatt 
acttgagtct 
atgtggcttc 



atcagttttc 
agtgacaatt 
aggagatat t: 
tcacggcccc 
ttcaggctcg 
tctcaaattg 
agttctggag 
tctcaactaa 
tcagcatgat 
ccttcagtgc 
gctcaaacta 
ttcagttttc 
ggagacaggg 
aatagtatct 
ctgttctgtt 
tttggcagag 
ctagaccaga 
tattcacttc 
ttcaacaaga 
ttcacattta 
acttttatta 
agtttttttt 
tgcaatggca 
gcctcagcct 
tatttttagt 
caggtgatcc 
tccagctt ag 
aatgaaaaca 
tttgctgagg 
agagtgcgtt 
caagaaggag 
gccccttttt 
aaaatgaact 
aattggactc 
catcagaaaa 
ctcgggtcgt 
cctacgggat 
caagcccctc 
gccctgggaa 
cttacttgaa 
tgccccacct 
tgccccccta 
acaactttgg 
gcctgcccca 
cccggaggtt 
ccttctcctt 
ggtctcccac 
cagcagcgat 
acatgaccgg 
acgaatgcaa 
agagagagca 
atggggtatc 
ttccgcctgg 
tgattttctt 
cctgctagcc 
tcttcttttt 
tggagcagaa 
ttcccaggtc 



aagcttagtr 
agaacttcct 
tat t ttgtt ~ 
cccgtcagca 
cccaggagga 
gaatcgaatc 
tttcacagag 
attcaagcag 
cccccaaacc 
gttcctaggg 
aacatcgtat 
cctgcccaga 
ctggctgtgg 
ttaccaagta 
ttcttgggtg 
gtgactgtca 
cagagccttg 
gctaagctcc 
gtagaagcga 
gttctcaggg 
acctatgaca 
ttttttttct 
caatctcggc 
cccaagtagc 
agagatgggg 
gcccacctcg 
gctatcttac 
gaatcaccca 
aggaaacgga 
ggaagccaga 
gagcaacttt 
ctttatttca 
ctgcccaaag 
caacccctcc 
ggacctcgat 
ttaccccatc 
cgagagaccc 
tgcaagaagc 
tacggtgtcc 
cgcgtcctac 
cccgccagct 
cggcatgaat 
cctcttcccg 
ccccatgctc 
gctccagccg 
taccggggcc 
ggcgggaaca 
ggcagccccc 
ctacaagacc 
cgtttgcgcc 
gtccaagggg 
gattgcattt 
cttttgccac 
ctgaataata 
tgtgattttt 
aagactgtct 
atgttaggtc 
cacctgagag 



gt ctttctca 


8160 


gcctgctggg 


8220 


tagtggctr c 


8280 


tcttccctga 


8340 


actgaraacc 


8400 


cctcaagcca 


84 60 


ttcatncra 


8520 


agacatttn z 


8580 


tgctgcctct 


8640 


caggtgtcct 


8700 


gttttactt" 


8760 


tgggtgtttt 


8820 


cagggatagr 


8880 


ataacgtgcc 


8940 


cgctaagtaa 


9000 


cgccttgtga 


9060 


gtgaagrgcr 


9120 


ttggcatagg 


9180 


aaattgatga 


9240 


tatgctgat t 


9300 


gggtccccac 


9360 


tttttgagac 


9420 


tcaccacaac 


9480 


tgggattaca 


9540 


tttctccatg 


9600 


gcctcccaaa 


9660 


tccagcctaa 


9720 


aggctgctgr 


9780 


actgcacttt 


9840 


tatgtggcga 


9900 


ggcagttttg 


9960 


gcacaaacac 


10020 


aatgtcccaa 


10080 


aaaggaaagg 


10140 


gactttagaa 


10200 


cgggcccctc 


10260 


acgtacatca 


10320 


agccccgacc 


10380 


cctgtgggcc 


10440 


ggcacggaag 


10500 


ttcatcccct 


10560 


tgtaatggcc 


10620 


aggctgtgcc 


10680 


aaccccactt 


10740 


gagcatccca 


10800 


gccgccagca 


10860 


gccgccacgg 


10920 


agcagcgacg 


10980 


cttccctacc 


11040 


aagactttcg 


11100 


ctgtgagtgc 


11160 


gcagtagtat 


11220 


ttctagctct 


11280 


aaaaaattag 


11340 


gtgcttttaa 


11400 


tgatgctttt 


11460 


tcagagccag 


11520 


tgcacagtgg 


11580 
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agaacggcct ttcaaatgtc agacrtgcaa caagggcttt actcagctcg cccacctgca 11640 
gaaacactac ctggtacaca cgggagaaaa gccacatgaa tgccaggtgc gcagtatttt: 11700 
ctgggtagac cttctgacct ttgtagaaaa tgtctgtgag tcaccctccc atgtccta^a 11760 
tagcccgtag ttaaagccaa caccagaitc ngcgttgtcc catcctggac tgatggcact: 11320 
atggtccttc ccagtacttt gtatctgctg angacttgag atggcacagc cagcttccag 11380 
tgggtgggaa aatggtaggg gaaataaaca gcccctcgtg tgctgtgtgc ccacatcccc 11940 
ccgtttgctt aataccacac tggaggtgcc acaaggaggc ttctcacctc ctaggttgct 12000 
gggcgttggc cggtaagcct gcccctcccg ttggcaactc ttaatcttct ggccttcctg 12060 
tctcccttcc ctgctgtctc tctcccctac actgtaggtc tgccacaaga gatttagcag 12120 
caccagcaat ctcaagaccc acctgcgact ccattctgga gagaaaccat accaatgcaa 12180 
ggtgtgccct gccaagttca cccagtttgt gcacctgaaa ctgcacaagc gtctgcacac 12240 
ccgggagcgg ccccacaagt gctcccagtg ccacaagaac tacatccatc tctgtagccr 12300 
caaggtrcac ctgaaaggga actgcgctgc ggccccggcg cctgggctgc ccttggaaga 12360 
tctgacccga atcaatgaag aaatcgagaa gtttgacatc agtgacaatg ctgaccggct 12420 
cgaggacgtg gaggatgaca tcagtgtgat ctctgtagtg gagaaggaaa ttctggccgt 12480 
ggtcagaaaa gagaaagaag aaactggcct gaaagtgtct ttgcaaagaa acatggggaa 12540 
tggactcctc tcctcagggt gcagccttta tgagtcatca gatctacccc tcatgaagrr 12600 
gcctcccagc aacccactac ctctggtacc tgtaaaggtc aaacaagaaa cagttgaacc 12660 
aatggatcct taagattttc agaaaacact tattttgttt cttaagttat gacttggtga 12720 
gtcagggtgc ctgtaggaag tggcttgtac ataatcccag ctctgcaaag ctctctcgac 12780 
agcaaarggt ttcccctcac ctctggaatt aaagaaggaa ctccaaagtt actgaaatct 12840 
cagggcatga acaaggcaaa ggccatatat atatatatat atatatctgt atacacatta 12900 
tatatactta tttacacctg tgtctatata tttgcccctg tgtattttga atatttgtgt 12960 
ggacatgttt gcatagcctt cccattacta agactattac ctagtcataa ttattttttc 13020 
aatgataatc cttcataatt tattatacaa tttatcattc agaaagcaat aattaaaaaa 13080 
gtttacaatg actggaaaga ttccttgtaa tttgagtata aatgtatttt tgtcttgtgg 13140 
ccattctttg tagataattt ctgcacatct gtataagtac ctaagattta gttaaacaaa 13200 
tatatgactt cagtcaacct ctctctctaa taatggtttg aaaatgaggt ttgggtaatt 13260 
gccaatgttg gacagttgat gtgttcattc ctgggatcct atcatttgaa cagcartgta 13320 
cataacttgg gggtatgtgt gcaggattac ccaagaataa cttaagtaga agaaacaaga 13380 
aagggaatct tgtatatttt tgttgatagt tcatgttttt cccccagcca caattttacc 13440 
ggaagggtga caggaaggct ttaccaacct gtctctccct ccaaaagagc agaatcctcc 13500 
caccgccctg ccctccccac cgagtcctgt ggccattcag agcggccaca tgacttttgc 13560 
atccattgta ttatcagaaa atgtgaagaa gaaaaaaatg ccatgtttta aaaccactgc 13620 
gaaaatttcc ccaaagcata ggtggctttg tgtgtgtgcg atttgggggc ttgagtctgg 13680 
gtggtgtttt gttgttggtt tttgttgctt tttttttttt ttttttttta atgtcaaaat 13740 
tgcacaaaca tggtgctcta ccaggaagga ttcgaggtag ataggctcag gccacacttt 13800 
aaaaacaaac acacaaacaa caaaaaacgg gtattctagt catcttgggg taaaagcggg 13860 
taatgaacat tcctatcccc aacacatcaa ttgtattttt tctgtaaaac tcagattttc 13920 
ctcagtattt gtgtttttac attttatggt taatttaatg gaagatgaaa gggcattgca 13980 
aagttgttca acaacagtta cctcattgag tgtgtccagt agtgcaggaa atgatgtctt 14040 
atctaatgat ttgcttctct agaggagaaa ccgagtaaat gtgctccagc aagatagact 14100 
ttgtgttatt ctatctttta ttctgctaag cccaaagatt acatgttggt gttcaaagtg 14160 
tagcaaaaaa tgatgtatat ttataaatct atttatacca ctatatcata tgtatatata 14220 
tttataacca cttaaattgt gagccaagcc atgtaaaaga tctacttttt ctaagggcaa 14280 
aaaaaaaaaa aaaaaaaaaa gaacactcct ttctgagact ttgcttaata cttggtgacc 14340 
tcacaatcac gtcggtatga ttgggcaccc ttgcctactg taagagaccc taaaaccttg 14400 
gtgcagtggt ggggaccaca aaacaaccag ggaggaagag atacatcatt ttttagtatt 144 60 
aaggaccatc taagacagct ctattttttt tttgccactt tatgattatg tggtcacacc 14520 
caagtcacag aaataaaaaa ctgactttac cgctgcaatt tttctgtttt cctccr-cact 14580 
aaatactgat acattactcc aatctatttt ataattatat ttgacatttt gttcacatca 14640 
actaatgttc acctgtagaa gagaacaaat ttcgaataat ccagggaaac ccaagagcct 14700 
tactggtctt ctgtaacttc caagactgac agctttttat gtatcagtgt ttgataaaca 14760 
cagtccttaa ctgaaggtaa accaaagcat cacgttgaca ttagaccaaa tacttttgat 14820 
tcccaactac tcgtttgttc tttttctcct tttgtgcttt cccatagtga gaatttttat 14880 
aaagacttct tgcttctctc accatccatc cttctctttt ctgcctctta catgrgaatg 14940 
ttgagcccac aatcaacagt ggttttattt tttcctctac tcaaagttaa aactgaccaa 15000 



WO 99/67395 



PCT/FR99/01513 



59 



<210> 66 
<211> 46340 
<212> ADN 

<213> Homo sapiens 
<400> 66 

tattttactt cagtaacaga aaatgaaaga aatgttttaa tgttgctgat tgtattacct 60 
tcaggatcaa tagcagaagg acaaacttct ttgaggagat ctcctagtgt gtgcaactgt 120 
ccatctgcag ccacaggacg aaacagcttc tgaatgaaag gtctttcagt cgttgtctat 180 
ttgaaaaagg aaaaaatgat tcaagcaatt aagtctttgt tgctgccaat tacaaattta 240 
tatatcataa actttatgtt ggcattaggt gccttttgat acggtgttag cataattaca 300 
caacatcaca gatgtggtat cactgtgaaa aatgtttaac atgataaatt caggtaaatc 360 
taattctgag gaaacagaca aatccaaagt tgggtgggac attctaaaga taattggctg 420 
ggacccttca aaaacttaaa gacattaaaa agcaaacaac acaaaaagat atcaacaaaa 480 
gcattttttc tcagtatctc ttaaagagac taacaaagca aatacaaaac ataaaccatg 540 
gctgaatact aaattgaaga aggacatttn ttagaaatcc aactatgaaa cacagttttg 600 
ggataaatgg ggaaatacag aatggacaac tgataatatt artgagttaa tgtcaaattt 660 
cttaggtaca ataaggacaa tccttatttt taagaaattc attgttcaag tgtttaggaa 720 
agaagtgcca tgatatccaa aacttaatct tctttctctt tttttggaga cagagtctcg 780 
ctctgccacc ccggctggag tgcagtggcg cgatctcagc rcactgcaac ctctactttc 840 
caggttcaag tgattctcat ggctcagcct cccaagtagc tgggactaca ggagtgcgcc 900 
accatgtcca gctaactttt tgtattttta ctagagatgg ggtttcacca tgttgcccag 960 
gctggtctca aactcctgag ctcaggcaat ctgccggctt cggcctccca gagtgttagg 1020 
gttacaggcg tgagccaacc gctcctggcc ccaaaactta accatctaat ggttgagaga 1080 
gagacagaga gagagagaaa gagagagaca gagaatgtgt gtgtgtgtga agacaaagca 1140 
aaaataaaaa aatattaact aatggtgatt ctaggtagag ggtgtatgat tttagtagtt 1200 
tcattatttc aacttttcga taggtttcac aatttccaaa acagcagatc cagccatttc 1260 
atctgacaaa aactgttagc agcactacat cgtaatttat tgctaataat ctcattgttt 1320 
tactcttaaa attgtttcat ttactaaatt tccttagtga tgatggaggc tttatcatga 1380 
cagagtacag aggctctgaa atgagccagt gtctatgaag agcaccactg tttgcaagat 1440 
ctatgatctt gtacccagtt tcctttatct gttaatttgg gacattccat atctcttgag 1500 
tttgttgtgg aaataaatga gcaactttgc caaccacaga gtaaataaat aaatgttaaa 1560 
gagaataaaa gcatttttac ctcctctctc cctcttaacg gttatttcac tttaagargg 1620 
taaattttaa gctttctgag atgaaaaatc attaaaactt aacaagaaca gagaaatgcc 1680 
atacatacat attttttgtt tgcttgtttc ctgagacaag gtttcactct gtcacccagg 1740 
ttgaattgca gtggtgcaac ccccaagttg caatcctcca cctaagcctc cagagtagct 1800 
gggactacag gtgtgagcca ccatgctcag ctaatttttt tacttttttg tagaaggggg 1860 
tctcactatg ttgcccaggc tgcctcatat tttataagaa tatgacttca aacacttagg 1920 
cattagcgac aaggttttgt ttttgtcttt taatgacaga ggtatacctc aacatatttg 1980 
acacaactgt tagagatttg gtttaaaaag aaatagacat ggatgaagct ggaaactatc 2040 
attctcagca aactaacaca ggaacagaaa accaaacacc tcatgttctc actcacaact 2100 
gggagctgaa caacgagaac acatggacac aggcagggga acatcacaca ccaaggcctg 2160 
tcggggagta gggggctagg ggagggatag cattaggaga aatacctaac gtagatgagg 2220 
ggctgatggg tgcagcaaac caccatggca catgcatatc tatgtaacaa acctgcacat 2280 
tctgcacatg tattccagaa cttaaagtat aatacaaaat gaaaaaataa ataaaaataa 2340 
gtagaaaaaa taaacatgta agcatgtgag ctgcctttcc taattctatg tttatgtatt 2400 
cactgaatac atagtatttt aaaatagtaa tccaataata tatttgagtg tttgtgacaa 2460 
gtatgaaaat tgtaattttt aaaaaatctt gataatatgc attgaatatg atttaattca 2520 
cttcactatt tgaactcttt agggattatt tttaaaaata tgattgatat cctttgatat 2580 
gttttggctc tgtgtttcca tccaaatctc atctcaaatt gtaatcccca cccgtctagg 2640 
gagggactgt aatccccatg tgtcgaggga gggaggtgat tgggtcatag gggtggtttt 2700 
cctcatgttg ttctcgtgat actgagtgaa ttctcatgag atctgatggt tttaaaagtg 2760 
gcagtttttc ctgcactctc atctctcttt cctgctggct tgtgaaggtg cctgcttccc 2820 
tttctgccat gattttaagt ttcctgaggc ccccacaagc catacggaac tgtgagtcaa 2880 
ttaaaccttt tgcctttata aattatccag tctcagatat ttctttaaag cagagtgaaa 2940 
acagactaat acattcttca atttaaaaag ccatactttc tcatacaagt tgaaaccaag 3000 
aacaatatca tgcataatca agtgattaac tgtgtaaaga taataaggtt gaggagttca 3060 
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gagaagaaaa gaaatgaata gggaactgta gtgataattt aaaatagcca tccctcactc 3120 
agggtttttg atcttcaggc catgaagaag cttttaatgc tttttagcaa aggaagtaat 3180 
gttggtgaaa ggctttttct gacgactaat ggaaagcagr gctatgtarg gtgacttggr 3240 
tatgaaccaa aaccagaatg actggtgaga ggctgactga aracagcaag cttatgrgaa 3300 
gacaactgga gctggtgcag tggaaaagga agacagcagg actgtaccca caactcaaag 3360 
aaaaaagtca gaaggtacct cccgcagtcc aacctgaaaa caacaaagtc aaaggaatct 3420 
tttcaagaat ttggagctct cattcatatc ctaattagtg tatgaaatgr gaggtggctt 3480 
tgctataatg aaattacctg gaatatttct aacacaaaga aataataaat gcttgaggtg 3540 
gtgaatatcc tcatttgatc attacacatt gcatgcttat agcaaaagat tacatgtacc 3600 
ccataaataa ttgcaactat tatgtatcca taataattaa aactaaaaga ttaaaaatta 3660 
cctgaaaaaa aatgctaaac aggaaaggcc aactagtctt ggttacatar taaaaaacag 3720 
aaattcttct ctaacctcac tattggagaa atatcctgrt attttt atat atcttttttt 3780 
tcaccctttc ccaaatctga gcaagtatta taaaggtata accttcaaca atcttttatg 3840 
atgaggtatt tgcttactgg ggacaaagcc ccagtgctat tacatagtgt agctaaacgc 3900 
tgtagaatgg taaaaacaag aaaatgctca gcaaagtgtt gtttctcatt taatgaaaat 3960 
cttattttaa aacacaaaaa ctcaatatac cccaaccaaa aatctgatga acattttctg 4020 
tttaatattt attatacagt acctttaaaa acgtaatatt cttattctta aaaatttagt 4080 
gtgctagcaa atagcaatta agtacctaag tcaatcagga cgacaaaaaa atactcaatt 4140 
tggggagtta gttacttcta tcatctgaat gcgtccctcc aaaattcatg ctgaaaccta 4200 
ttcctcatca tggcagtatt aagaggtgaa gcctttgaga ggtaattagc tcatgagggc 4260 
agagtcctca agaatgggat caatgctctt ataaaagagg ccccagggag cttgtaaggc 4320 
ttttgcccct tctgccatgt tgggggggtg ggggtggggg cgcagcaacc agtgctaact 4380 
ctgaagcaga gagcagccct caccagaaac cgaatctgtt gaagccttga tctctgactt 4440 
cccagcctcc agaactgtga gaaataattt tctgttgttt ataaattacc cagtctaggc 4500 
tgggcgtggt ggatcacctg aggtcaggag ttcaagacca gcctggccaa tatggtgaaa 4560 
ccccatctct actaaaaata cagaaaatta gctgggcata gttgtgggcg cctgtaatcc 4620 
cagctactca ggaggctgag gcaggagaat cacttgaacc cagaaggcag aggttgcagt 4680 
gaatcaagat catgccattg aactccagcc tgggcaacaa gagggaaact gtctcaaaaa 4740 
aaaaaaaaaa aagtacacac tctaacatat tttggtatag cagcccaaat ggaatggact 4800 
aagacaatta cccttaaaat aaaagctccc atagagagat catgcattca agtacagagg 4860 
ttcttaaggg caatgggaat ggaggacata ttcctgcaaa cttttcaaca gctctcatta 4920 
gcccgatgtt agagctctgc aaagaagact aaattatact gagaaatatt tttaaatctc 4980 
cacaaatagg aatgctgtaa acgttgattt agtatatata aaattagaca agactaacaa 5040 
tatccaatgc aatctaaatc ttaggttgac agacaagaaa gccactgcaa acaggaatat 5100 
accacaatac ctgatcttgc cacatatttg taaatatgca aagtatttca ataacttcca 5160 
agaaacagta ttactctcat gagaaataac atgatgtaag tcacctttga aactgtcctt 5220 
gttacttttt caaatgtatg ttagtcattt cttaacacca aargaaatga aaaactgagg 5280 
tggtaatggc tggctgctcc catctctcct ctactcatgt gccttcacca atacagcaat 5340 
cattttttct tatatgggaa atttacagtg ttgatatagc tcagagatat attgaagaaa 5400 
agcagaaaaa cgaaacttat aaacatttta ggaaacctta tgtattttct taaatagttc 5460 
aagtgtaaaa cttagaattc ttataaataa tgtgtgttac agctatattg taaatggtgg 5520 
ctcatgcctg taatcccagc acttcaggag accgaggtgg gaggagagct tgagcccatg 5580 
agtttgagac tcacccgggc aacacagaga gacctcatct cttaaaaaaa aaagaaagaa 5640 
agaaagaaat gaaatgcaaa gaaaaagtct ctatttcaaa tgtagccagt agagccaata 5700 
ggttaaccaa tattaacatt aacgttgata aaacaagaaa tgatgattta ctataagctg 5760 
aaaatcagac aatgtatgga ctttaagagt aacaggcacg atcatcacaa acttaaatca 5820 
ggtttgagtc ctatgagtta tatacagtta catgatgcaa caaaagatgc cagccagttg 5880 
ttaaagagta ttagattcgg ctgggggtgg tggctcatgc ctgtaattcc agcactttgg 5940 
gaggccgagg agggaggatc acgaggtcgg gagtccgaga ccagcctggc caatatagtg 6000 
aaacctgatc tctactaaaa atacaaaaac tagtcaggca tggtggcacg tgcctgtaat 6060 
cccagctact cgggaggctg aggcaggaga attgcttgaa cccagggggc ggaggttgca 6120 
gtgagccgaa atcgcgccac tgcactctag cctgggcaac agagcaagac tctgtctcaa 6180 
aaaagagtat tagattcaag tcctgtttct gtcatttatt atggaaccat ggacacaact 6240 
acctatcttt cctgaacctc agttttttca actgcaaaac aggaatatat acatatgtgt 6300 
atatatacat ctgtgtaaac acatatgtgt atatatacat ctgtgtaaac acatatgtat 6360 
atgtataaat ggagataata cctacattat agtttctgag ataataaaat gcacaacaca 6420 
attctgacac ataacaattt gtaacttaaa acataccatc accagggcca ctagttttag 6480 
aacactgtaa tgcatagtct aatttaatac tatgcaaact gtgttcactc aaggttttat 6540 
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ttccttttaa tttcattcat ttactcttca gttgtttgta agctaaaaag tccagaatca 6600 
tgaaattcag aagtttacgt tttaatgttt ttctatatgg caaggaaaaa aaaaagggca 6660 
aagtcatttt aacactactt tcaaaatcag cctagaactt aacactaaag gcatgaccc- 6~20 
taaaagggaa tactaataaa tagacttaat taaaattaaa caacaacaac aacagctaag 6~30 
cttttgttct gcaaaagatc ctgtgaagag aatgaaaaca taagccgcag gctgggagaa 6840 
aatatttgca aaccatattt ccgagaaagg tcttgtgtct ataatatata agaactccca 6900 
aaattcaaca gtttttaaaa aaagcaaata atccaattag aaaatgggca aaagacatga 6960 
acagacattt taccaaagag aatatatagg tggcaaataa gcatatgaaa acatatctca 7020 
cacatcatta gccattaaag aaatgcaaat taaaaccaca atgtgatatc attacacacc 7080 
taccaaaata tccaaaataa aaattagtgg taacaccaaa tgctggtgcg catgtggaaa 7140 
aatagtcctt cacacactga tggtacaaat gcaaaacagt acagtccctc aggaaaggag 7200 
tatggcagtt tcttacaaaa ctaaacatgc acttaccata tgaccaagra attatactc: 7260 
tgaatattcc cagaagtaaa aatgtcttct ccaaaaaact tatacatgaa cgttcacagc 7320 
tgttttattc gtgagagtca aaaacagaaa gcaatcccag ggctacccat taaaacaggt 7380 
gaatgcttat aaactgactg taataggtct gtcccacgga atactactca gcaataaaaa 7440 
ggaacaaact actggtatat gcaacaactt ggatagatct caagggagtt atgttatgtg 7500 
aaaaaagtca atctcaaaag gttacacact gcatgactcc actgatataa cattagtgaa 7560 
atgacaaaaa ttttagaaat ggaaaacaaa ttagtagttg tcagaggtta gggaagaaat 7620 
gcagtaaggt aggtggctgt ggctataaaa gggtagccta agagatcctt ctgttgaaac 7680 
gggtatattt tgaatatagg gtgaatttac atatgtgata aagattgcat agaactaaat 7^40 
acacacacac agtatatgta aaactaagga aatctgagta aggtttgtgg attatattaa 7800 
tacaatttcc tggttgtgat actgtactgt aattatgcaa gatgttagaa ttgggggaaa 7860 
ctagatgaag ggtatgtaga tctttctgta ttatttctta caattgcatg tgaatctgta 7920 
attatctcaa aataaaaatt tttttcaaaa tttcaaaaca actagtctag agctttgtta 7980 
atcaaagttt tctctgagga cctgtagcat tttggttatc acctggatct tattaaaatg 8040 
tagattctca ggctgcatat tggaattcct gaattggaat ccgcatttta acaagatttc 8100 
caagtgattc atgtttaaag tttgagaagc actagtctac aacaatgact tttaaccttt 8160 
caacctactc taacacactt gaaggccata acaaaattca catcaataac agttgctcgg 8220 
ttggacagtg actctcaaca caaatgagtg aggaaaggtg gggactcaag actcaggtag 8280 
caggaaaagc cccttaggtg atcctgatga aatgttttct ccatcctggc tgaaaaaccc 8340 
agaacagtca attaaggctc aaaacaaaag taatgtttat aatactggag atctttaaaa 8400 
ggcagataat atatactata acagagcaaa ggtaattatt acaatgtata aatcttataa 8460 
gaaccaaaat cagaattaaa atcactaagc acataatgaa aatcctttaa aaagtataaa 8520 
aatgaatgta gtctaagtaa atactaataa tggcagttat agtgagaaaa gctctagagt 8580 
cttttactct tcatacttcc tagtcacaaa catctatttc caaaactgac ccttcgtatt 8640 
tcaaataatt tatggcctgg tacagtaata agagcatgat atttaaagcc agtcagaaga 8700 
cacatattct agctctggat ggcacttgat gacgatggat tcagcttatg gttccaatcc 8760 
cagctctgtc aattagtacc tatatgaccc tagtcaaata cttaaacctt cttgtgttac 8820 
ttgtgtgtca attgtatcat ctataaaatg aggatattaa cagtatatac ctcatagatt 8880 
tttttgtgaa ggttatacaa ttaattcata taaagtattt agaacaatgt ctagcacagt 8940 
gaattctcaa tgagtgttat aattgttctt tttaaatgtg acttgactct caacagaact 9000 
ctactgaatt ctaatatgta ttctgtattg agctgtcaaa aaaaataagg attataataa 9060 
catatactat tcttgtagtc aaccctgtta ctatgttatt actagtgtca gttttgttgt 9120 
tttggtcata catattgttt tacatacatt aagaattatt agaaatgttg gtttattaaa 9180 
aatgaccatt tatggctaga agggtatata tctggctcac tgactgtgga gtcaatgtcc 9240 
ataaagagga ggaagaatgc catcagagta aaaggagatt ctattcactg aaacaaagtg 9300 
ataaaaagct atgaaagaga aaaacataaa ataaccaaag gggtgaaact taacagatgc 9360 
ccagtagatg cacaatgcac tgggttgtaa aacttaaaat ggccttaatt aaaagccaag 9420 
cacggatgga ggtgctgggg gagtctccta cggacacagc aggcagaatg taacaatgac 9480 
aaggggctca agtttattta aaaagagatt ggacaggccg ggcgtggtgg ctcacgcctg 9540 
taatcccagc actttgggag gctgaggcgg gtggatcatg aggtcgggag ttcgaggcca 9600 
gcctggccaa catggcgaaa cctcatctct actaaaaata aaaaaaatta gccgggagtg 9660 
gtggcgtgca tctgtagtcc cagctactca ggaggctgag gcaggagaat cacttgaacc 9720 
tgggaggcaa aggttgcagt gagctgagat catgtcactg cactccagcc tgggcaacag 9780 
agtgagactg ctcaggatct cccaaagacc caaatccctg taaactgaat gcataatatc 9840 
atttgctcca gtgaggctta gatggacatt ctagtcttct tggttgagct gaagaaacaa 9900 
atattatatt gataatttat gtatgttgta tttttcaagg tatagcaaca agtttttatt 9960 
c'atcagctac tttgtgtgtg tgctttgttt ttaagtcttt tgaaacagga tggtgattta 1C020 
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ctacatttat 
tcacttgtta 
gcaaagttca 
tactatgtgt 
gtgaaaaaga 
gaactgaaaa 
actaactatg 
tggatggctg 
gcggat cacc 
aacaaaaata 
gaggctgagg 
gtcccactgc 
caaaacaaaa 
cacttgacac 
ataaatatta 
ttcttataga 
gagaatcaag 
aattacaaca 
acctatgttt 
ctggatagaa 
ggcaggaata 
ggtatcacta 
tatgtgataa 
attttaactc 
ttcattttct 
gtagaaagta 
aatatagaag 
agataaagtc 
agtggataag 
tgtagtggaa 
tagagcaaat 
ttatctttga 
gtgcttaaca 
aagaaaggta 
gtattctaac 
aagaaaaaga 
atgatatctg 
attttacatc 
atatacaata 
tttacagtaa 
agtctgtagc 
ataagcactt 
actaaaaaat 
ctccaaagga 
tatccacaat 
attctgtcta 
caaataagcg 
gagaagtaat 
ttacagaaca 
aaaagaagct 
tctaaaattt 
cattatatat 
actaatacaa 
ctgcatatga 
ttaattagta 
gtgctgacct 
gaaaagtgat 
cctcacccct 



aagtaaaatt 
tatttgcagg 
tttattgatt 
tatttaagaa 
ctgctctcat 
ggcattttag 
agtgtgcttg 
ggtgcagagg 
tgaggtcagg 
caaaaattag 
caggagaat c 
actccagcct 
ctcaaaaaac 
acaattttga 
gtgaagcttc 
tctttagcaa 
tagctgctag 
aagaatattg 
aacaaaagca 
ttatcttaat 
aattttatca 
tgctaatgga 
cagaaatatg 
tggacttact 
aagagttgga 
aaatattaca 
gtcttcaagc 
atttgagtat 
gagagaaaag 
ataacaaagg 
tacatcaacc 
acaattgatg 
atgactagtt 
acagtattta 
ttcagtttcc 
aaacaggggt 
cttcaactgt 
acatggtttt 
cctcattaaa 
acagtctttt 
acttatcaga 
tctgtactta 
aataattaac 
gaagtttctt 
ctggtttgga 
gacagtgcca 
caacactttg 
acttcccttt 
aatggtattg 
tcatataaaa 
tctcccaaaa 
aatagcttta 
aaagaatgta 
acatgtttta 
taaacaaaga 
caaaagtgaa 
tctaaacctg 
caaggaatgg 



tatttgattt 
tgcttaaaaa 
aatcaagaat 
ttaaatctag 
ttttgtacaa 
aaaaactaga 
ttcatgccca 
ctcatgcctg 
agttcgagat 
ccgggcgctg 
acttgatcct 
gggcgagagc 
cctattggca 
gataatgaac 
attgctgaaa 
aaacaaaaaa 
ttgagtaata 
tttttatttc 
taggtacaac 
agtagtaccc 
gaaatcttca 
tacaaagata 
tacaaagcac 
ggcatttaga 
agctatatca 
acagtagaga 
ttccagcttg 
tcagagggca 
tggactaaag 
tttggttgga 
tttgggagta 
tgataattaa 
cttttcattc 
gttgttacag 
tttgaagtct 
ttacacagga 
cccatgcata 
caaaagaaga 
taaaaagaac 
ggtggtagaa 
ctacttttat 
tgttgagagt 
atttgaaaag 
aattgatact 
gtttatgttt 
aatgtacttt 
tttcctcttc 
cttgggatcg 
cttttaaatt 
gtgctaggat 
gatctgaaaa 
aaatatcttt 
attaataaac 
tccttttggt 
aatcaaaata 
attctgttct 
ggctaggagc 
tctatgggtt 



acaagggttg 
atcagctata 
ataattagat 
aaaagggatg 
caattactaa 
ttttacaatt 
aaagctacct 
taattccagc 
cagcctggcc 
tggcgggtgc 
grgaggcgga 
ccagagcgag 
attactaggg 
cgaacttact 
tggtgacaaa 
accccaagca 
gtggtaatag 
ctgtccatgt 
aacgactact 
aagtgcagga 
trcattacat 
aataacatgc 
t atgaaaaaa 
gcaaaaccaa 
gtaggtacaa 
atttcaaaag 
aaatacatat 
gactgaatat 
gccatagcat 
atcccaactc 
ctgtttctga 
atgagatata 
ctctcttgaa 
aacccattaa 
tgttaatgag 
tatgctgcca 
tttggcttaa 
ttcattaaaa 
agaccattt c 
agagggggaa 
cctttatgta 
ctgaagccca 
ctgtcattat 
atgattaaat 
tgtcttattt 
gtcatacaaa 
gtatcctttg 
agatcaattt 
tttatatgaa 
tgatattctt 
atcataccaa 
gctaattcta 
tattttcctc 
gtacttacat 
gcaagaagaa 
cttgatgccc 
tagtggagct 
ctgtggtgaa 



cttaagtgta 
ctaaactata 
ttgcctaact 
gact ctggaa 
atttctaagt 
tataactcra 
tccaaaatta 
actttgggag 
aatatggtga 
ttgtaat ccc 
ggttgcagtg 
actccgtata 
ccatcaaatc 
atttttgaaa 
gatgaatagc 
tactatggta 
gcactacaat 
tttaaaaaag 
actactaaca 
tctctaagta 
atttactatg 
aaacaactgt 
attacaaagc 
aacaatccta 
agtaaaatat 
aagataaaaa 
ttttttttaa 
aatggtactt 
atagagcttg 
ccaacaacgt 
atctgaaaaa 
tgaaatatct 
ccattgtgaa 
gagagaataa 
aataaatatt 
gactttacca 
gatatattca 
ttagcttaag 
caaatgaatg 
cagagagggg 
gagaaatagg 
cttttaatag 
tatagtcagg 
aaaagcatcc 
aaattgttat 
cacttgaggc 
actgaataac 
gatgcttgtt 
cttat cagta 
agtaataatt 
gggaagtata 
cccaaagcca 
tgaagaatca 
aaaataatta 
atgtctgagt 
agttaagtgt 
cttcaaacag 
cgctaaagtt 



tcacaggatt 
actggaat ta 
atataagtag 
atatcaagaa 
agcattaatt 
ataaaacaca 
aaaaccctat 
gccaaggcgg 
acccgtctct 
agctactcgg 
agctgacacc 
t taaacaaaa 
agtatatttt 
atattacata 
aataaaactt 
cattacttta 
gatataaaca 
ctttggtttt 
tataagtagc 
atgatcagaa 
catttaccag 
aatacagtgt 
ttgagcacaa 
actggttaat 
gctaattgtg 
taatggaggg 
atagagaaag 
ctgagaaatc 
gaatgtcaaa 
actgtgtatc 
tgaggaaaac 
aatgtaacaa 
acgtagaacc 
aaaataactg 
atgtggcaca 
acaatgacac 
tgcatatcaa 
aatgtacaca 
cttttagagc 
agtgggtggg 
agagttgaaa 
tcttgacaac 
gacacttaat 
atcagaatta 
acttattata 
aaattttctt 
gtgtggtaca 
ataagcccat 
gactagccaa 
aggtaaattc 
gtttaaattt 
cactaaaaag 
aagggcactt 
agaaacactt 
aaaagcagct 
ctaacccagg 
tctcacctac 
tataacatgg 



10080 
10140 
10200 
10260 
10320 
10380 
10440 
10500 
10560 
10620 
10680 
10740 
10800 
10860 
10920 
10980 
11040 
11100 
11160 
11220 
11280 
11340 
11400 
11460 
11520 
11580 
11640 
11700 
11760 
11820 
11880 
11940 
12000 
12060 
12120 
12180 
12240 
12300 
12360 
12420 
12480 
12540 
12600 
12660 
12720 
12780 
12840 
12900 
12960 
13020 
13080 
13140 
13200 
13260 
13320 
13380 
13440 
13500 
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gaatatttat 
acatcaaagg 
aagtgataaa 
catagcactt 
tctttaaaaa 
atacggcaac 
aagttaaaaa 
acaaaatatt 
gtaaaactta 
acaattctcc 
tggtcattag 
tgtaattaaa 
catacactga 
ccccaaaggt 
cccaagagaa 
ttttattcat 
taaacaaaat 
atacatgcta 
aaaaggccat 
agtagttgcc 
gtttcttttt 
ctgtgtaact 
cctttgctga 
cttgagccag 
cacaccagcc 
agggtgacct 
gttatcatat 
gatttatacc 
aaattatatt 
aagatcagag 
aattgtatag 
actgttcacc 
tttgaaatta 
gagtaatatg 
tgctacccac 
caccagttag 
tctggattcc 
aactcttcct 
aatccaggtc 
ttaactatta 
caatatctga 
tttcagattg 
ccacaatgga 
ttattaaaca 
tttaggtgac 
aggagcattc 
taatcactgt 
ggcctcatga 
cttaaaatat 
tt ccccagaa 
tttaacgtga 
tggcttagaa 
gtaaatttgt 
agttacactt 
ccgcagctaa 
agaattgtcc 
ttacttctta 
gttaatacag 



tattttgttt 
gaaattt cat 
tattttacag 
gaatactatt 
aaatataaga 
ctaaaaatac 
cttttgttct 
tgcaaaccat 
taaataaaaa 
taagaaatac 
gaaagagcaa 
actatagaaa 
tggtagaaat 
ttaaacgtgg 
atgaaaatat 
aatagccaaa 
gtggtatctt 
caaaatgaat 
atattacatg 
aagggctgga 
agggtgatga 
tagaattcag 
gcatagtggc 
gagttccagg 
tgggcaacac 
ctgtagtatt 
gggtggcagg 
tatgcatcat 
tcataaaaac 
atacatttct 
catcatggtg 
aaaactcatt 
caatatgcta 
aaataaaagt 
attgtggact 
ggtagccaag 
cacccacact 
tttatagatt 
agagtttata 
tttacaatgt 
agagagaatg 
agataataat 
agttttaaaa 
gggttctaag 
aatttatcca 
tgtgtcaaag 
acttatttta 
ataactatca 
ggtgttttat 
atcatagtta 
acattttaaa 
aggcatgtag 
tagttctact 
tgatgtgtag 
aatgaacacc 
caagctgatt 
gaagtaacag 
gtattttccc 



ctaacacaaa 
aaaaatt ctt 
atttcaccac 
aaaaatatat 
ggaaaccttc 
aagcaaccaa 
tcaaatgaca 
atctgataag 
gttaaagaag 
gaatggctag 
aaaccaaaat 
ataagcgttg 
gtaaaatggt 
aattaccatg 
atgttcacca 
aagtggagac 
catacaacta 
gaaccttaaa 
atgctaatta 
gggaggggga 
aaatgtt ctg 
tgactcctaa 
tatagtccta 
ctgtactgca 
agaccatgtc 
gagattatac 
ggaaatcatt 
accttatgtt 
aaattttaaa 
accttatcaa 
attttaagtt 
taatattcat 
gtttaaaaag 
atcaaatatg 
cactgcgtcc 
aactcct cat 
gctgtgacct 
tctgaattag 
gttctatttc 
aagtacctat 
gtctattgaa 
aataccacca 
tagtataaac 
aaaatagtat 
tctgagaaat 
aattcactag 
aatccctctt 
accaaactat 
tcaaataatt 
aatgaaatct 
aacactctaa 
gtaaaaagga 
ccattaagca 
atcctttgaa 
tagtgaagag 
ctaagttact 
ataattacct 
tttagcaaag 



taatttttaa 
ttgaaatttt 
ttacgtaatc 
taaaaaggta 
gtgaccttgg 
agaaaaaaac 
tcatcaagaa 
agaccactat 
tcaattttaa 
ttaaatgcat 
gatatactcc 
gcaaggatgt 
gcagatgctt 
caacccagca 
aaacatttgt 
aatccacatg 
ttactgggcc 
aacaatatgc 
cataaaatgt 
atgatataag 
aaattttatc 
aaccaatgaa 
gctacttggg 
ctatgatcat 
tctaaataaa 
ttcaagtaag 
ctgggatgat 
tgttttatgc 
aaaattaaag 
ttcagaaaaa 
acctgtagga 
gttctgatac 
gtttactaaa 
ggaccattaa 
actgtttgcg 
cttcactttc 
gaatggggaa 
aatctggcat 
actattactt 
ttccacaaaa 
tccaaagtag 
attcatcaag 
attttaatat 
acatcaaata 
gcaaaagaga 
caaaagaggg 
cagaaccagg 
agaaaagagt 
ttatttaagg 
tccttactaa 
agcaacaaaa 
ctaaaaactc 
ttcctcaagc 
agccactcta 
tatgaatgct 
ttaaacatgt 
ttggcataat 
ctttgctttt 



aaatttatrc 
t agaagtagc 
r gat caacaa 
acataguaaa 
attaggaaar 
agacaaacr g 
aataaatccc 
tcagaata rg 
aatgagcaaa 
gaaaagatgr 
tt cat accca 
ggacaaatt g 
tggaaaacag 
attct actcc 
acataaata- 
tctatcaarr 
a~ aaaaagaa 
aagcaaaaga 
ccagaaggga 
tgactgccaa 
acgggaatgg 
tagcatgcrr 
aagctgaggc 
acctgtaaat 
taaacaaata 
ctgttattaa 
ggctaactrc 
attttgtggg 
tcaagaaccc 
ttacaagttr 
atttaaataa 
tgaaaatgaa 
atacataatt 
aaatgtcc" 
agcttttcca 
ttcctcacta 
gagaaacgcc 
tacaaaagaa 
atatggctrg 
aaattcaaaa 
gctgatacat 
tcaaattar a 
atagcaggct 
ttaatgtgct 
ctttggtaag 
tatactgtag 
tcttaaaaga 
gcaagagtgt 
ctccaaaagc 
aggaaaaang 
ctattcaat- 
taataatggt 
agtgtaaaaa 
ccctgtttta 
gcaatacata 
atgcagagtc 
gaaaaaaac" 
aaaagaaaac 



tactaaagia 
aaat aaagg z 
attttaaaaa 
actataaaa: 
ggtttcttac 
gacttcatca 
acagaatggg 
taaagaati: 
ggatctgaag 
ttagcatcac 
ctaagactgc 
gaaccctcc: 
tct gacaat a 
taagtatcra 
taactgcagc 
ggtgaattga 
tgatgtatt z 
aaccagacac 
gaaataaat" 
tgggcatggg 
ttgcacaac" 
taaaaggtga 
aagaggatca 
agccaccata 
aataaataaa 
aaaaaaaaaa 
atcagt attt 
ttttttaaaa 
caaaacaaca 
ttttcttaaa 
ctttgtctta 
gctgaaaagt 
tcattataag 
actaacaaa- 
gaacgctcgc 
gcttggaacc 
atagtaaggg 
caatgttata 
t cctaggaac 
ttttggaata 
cccaacagta 
tgcttatttt 
taacttatga 
tcttgtataa 
gggttgagta 
ttacaagcta 
tgataaaca- 
ggtgttctaa 
agcagcctca 
aatcacaara 
gtatgtgata 
tgggccaaaa 
tcagagttca 
tatgaagcat 
agcagacgtc 
agaatatgac 
tt aaatgtaa 
ttcaaaacti 



13560 
13620 
13680 

1 3 7 4 C 
13800 
13860 
13920 
13980 
14040 
14100 
14160 
14220 
14280 
14340 
14400 

14 4 60 
14520 
14580 
14640 
14700 
14760 
14820 
14880 
14940 
15000 
15060 
15120 
15180 
15240 
15300 
15360 
15420 
15480 
15540 
15600 
15660 
15720 
15780 
15840 
15900 
15960 
16020 
16080 
16140 
16200 
16260 
16320 
16380 
16440 
16500 
16560 
16620 
16680 
16740 
16800 
16860 
16920 
16980 
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aaattaaaat 
agaaaaggaa 
agaaggaaag 
tattatttct 
taatctatgt 
tacattggat 
ttctatattt 
tggttaaatg 
tgcacattaa 
tctgcagatt 
ttttcttgtt 
tatgaaatat 
tatatgcaaa 
ccagggaggt 
tcagtgaatt 
ttgtgtcaca 
gacatatggt 
caaactcacc 
ataacagtgg 
aagctaacca 
aagatatcaa 
gaattacatt 
aggagtttca 
tgcacacaac 
atctgcatgc 
ataaaaccaa 
tgatatcctg 
ggacattagt 
ctatatatta 
accaaaagca 
gtaattctgt 
atgagaagaa 
taagcagatt 
tcattctgga 
acataaagaa 
ctaagctgaa 
agcccatgtc 
gttctaacta 
tccaagaaat 
cagtagactt 
gatataaata 
tttaagccat 
ggtggctaac 
ccaggaattc 
aaattagctg 
gagaatcacc 
ccaccctggg 
aaaaaaatca 
ccaaagacat 
aagtcagtaa 
attattattt 
caatcatggc 
cctgagtagc 
tagagacagg 
aagtgctagg 
agaatttatt 
atcattcaca 
catatactac 



aggaaatgct 
ggattctatg 
aaaagagaaa 
ttcaaatttt 
tcctcttatc 
ttccgggtct 
catgtcattt 
aagttcaaaa 
ctcagccaca 
caactaacca 
atcattccct 
tataagtaat 
tactacacca 
cctggaacta 
caggattcac 
acatatacat 
ctact caaat 
attccattga 
ttct ctgaac 
ttgagaagta 
agtcagatga 
ttaatatacc 
agtatgcata 
aatacgtaac 
actgcaaagc 
aaaacaggca 
atatgaaatg 
ctttgtattt 
cctacttaaa 
actctcatat 
tcttaacaga 
cagaaaaaaa 
ttcttacacc 
tgccgacatt 
accaatatcc 
gtttgcaact 
aaccaatgaa 
ttctaaggta 
tctaacatca 
acattttgta 
ctatcaaata 
ctcacattta 
acctgtagtc 
gagaccaacc 
cgcctggtgg 
agggcctggg 
tgacagagtg 
aaactgatca 
cttaaggaga 
ggtcaatttt 
ttttttgaga 
ttactgcaat 
tgggattaca 
gtttcaccac 
attacatgcg 
tgtggagaga 
atctatcttt 
atgcatgagc 



ctact atgta 
agggaggaaa 
aggaggaaag 
aaacgagcag 
tatgcttgga 
tcagctctga 
ctatttgcaa 
ataagtataa 
cat ctaacac 
tgggtcgaaa 
aactacagta 
ctacagataa 
ttttatatca 
atcacccaga 
attatttcac 
gcagacaggt 
acggtttcca 
taagcgacct 
caatattgac 
catactgttg 
tacaactgaa 
ataagcaatc 
tgtcaatatc 
tgtacttata 
aaaagtataa 
tcacacacaa 
tcaaacaaaa 
ttaaattgat 
attattagca 
ttacccaaaa 
caggtgttgt 
aattagaagg 
atgaaattgt 
ctctatgatg 
aatagtaaag 
accaagaatg 
aaatgggagg 
taggctacct 
actgtaatct 
atattttctt 
attagctata 
acctaaactt 
ccagcacttt 
tgggcaacat 
tgtgcgcctg 
agatcaaagc 
agaccctgtc 
cttgaggtcc 
gatgaaatca 
tacatatatt 
cagagtcttg 
gtctgccttc 
ggtgtgcgtc 
gttaaaccat 
tgagccactg 
ggtaaagaaa 
caaaatgagg 
atgggaattg 



gtaaaaatac 
agtgggagaa 
aacacaagga 
aataaattct 
aaatttagac 
aaacaagctg 
atgttataaa 
catacattag 
agtcagccct 
atgtttttgt 
taacaactat 
tttaaagtat 
gactctcaaa 
ggtatcgaca 
aactagtata 
gactttcatg 
aatgtgt ate 
ctaccaacct 
cctcctttaa 
aagacagaac 
tgtttatgct 
tgcaaaagaa 
tgtatcaata 
tcatctcctt 
tataaaatcc 
gaactgaggc 
ttacccaggc 
tttttcttct 
aatagttatt 
gaaggaacca 
gtattctggc 
tagttttcac 
cagcagact c 
gaaagggact 
ttgaagaaat 
tattatgeca 
actgaaat ca 
ctggcgt at a 
gaggtccttt 
ctaagagctg 
gaacagct ct 
ttatcaaatg 
gggaggccaa 
ggtgaaaccc 
tagtcccagc 
tgcagtgagc 
tcaaaaaaaa 
aacttatgtt 
taaaaaggtg 
aggctagcat 
ctctgttgcc 
caggttcaag 
accctgccca 
gagtttggcc 
cgtctggcct 
actcattttt 
tattaactat 
aagttatttt 



tttttagar t 
aaatgt aaag 
cagaaaggee 
tttgt ttt at 
aaaatgtt aa 
tttct taaca 
gttcaatatg 
tttggctatt 
ccctat ccag 
accaaacatg 
ttt cacagt g 
acaagagggt 
catcagr aga 
gatggctata 
attttatgtt 
aaaagatt ac 
caatct tgt t 
gcttat cccc 
attgatagee 
atattctgta 
agat tatat t 
gcaacttgcc 
tgtaatatca 
agcactaatt 
caaaaaacct 
gtatacttca 
tcaggttaga 
aatatt cct t 
ttaaaagtat 
ctaccaagaa 
atgttacatg 
tatggaaata 
aataat cacc 
gaaagtaaaa 
aaacattctt 
gcagt aaatt 
atcattaaag 
ttatcagagt 
aaaaaataat 
tacattaaga 
attttcaaca 
tcaaaactga 
gatgggcgga 
catctctata 
tactagagag 
tgagatcgtg 
aaaaaaaaag 
tactatatct 
aggatgagaa 
aataaaaata 
caggctggag 
caatccttgt 
gctaattttt 
aggatggtct 
aaagtgt ctt 
agtgaaat aa 
tttggcttct 
att cct aagt 



act gaagcaa 


1^040 


aaaaaaagga 


17100 


tatrgaaata 


17160 


aactangaaa 


17220 


gagtaagtac 


17280 


tacgtcaatt 


17340 


atgtaaaaca 


17400 


ccaaatttca 


174 60 


gggttctgca 


17520 


t acaggcttt 


17580 


tgtacatgtg 


17640 


atgcataggr 


17700 


atttggtaac 


1^760 


tataaatcac 


17820 


gttcacataa 


17880 


acccaagata 


17940 


taattataar 


13000 


tccaagcaat 


13060 


tttttttaaa 


13120 


aaatgctccc 


13180 


tctaagctga 


18240 


taaagatttc 


18300 


atataatcaa 


18360 


attacaaaca 


18420 


tgaaaattta 


18480 


ttaatgagta 


18540 


aataaagata 


18600 


aatgataacc 


18660 


gagtaattag 


18720 


teaaagecta 


18780 


aaaatcactt 


18840 


ggtaagtgat 


18900 


ctaaggggca 


18960 


tgcactaatg 


19020 


tggacaggaa 


19080 


aggaaactaa 


19140 


cagcagcaag 


19200 


tgacaatt ct 


19260 


ataaaccagg 


19320 


ttttatttgt 


19380 


gttataacat 


19440 


ggcegggtae 


19500 


tcacttgagc 


19560 


aaaaatacaa 


19620 


gctgagggag 


19680 


ccactgcact 


19740 


aaagaaagaa 


19800 


acttatattc 


19860 


agaaaatagt 


19920 


tgagtgtctt 


19980 


tgcagtggtg 


20040 


gcctcagcct 


20100 


gtattttcag 


20160 


caaactccca 


20220 


attataacca 


20280 


ttaaaactgc 


20340 


aaaattaccc 


20400 


ttgagacttc 


20460 
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atgttttaat 
aaattccaga 
actttctgtg 
aaaaggaaga 
aaaaagttat 
aataatgatt 
ctcttctaat 
ttacctcagg 
aataaataca 
ttagctgcta 
taaaaatatt 
tgatttcatt 
ccagctataa 
ataaagcatt 
aacaaaatgg 
taaaatatat 
ctattccaat 
taatagttgt 
aagtctcaat 
ccccctacag 
tcaagtttta 
ataggaggaa 
ttgtccttga 
ttaaaaatag 
tgaagatcta 
gtacaagtca 
ttcttccagc 
aggaaatgtt 
gcatatgtga 
aagcactctg 
aagatgttta 
aacatcaaat 
aaatctaaga 
tgcaaatggc 
- caaaagtgat 
aaagaggaaa 
gtagattggt 
ggccaggtgc 
tcacctgagg 
gtctgtacta 
aggaggctga 
tcgcaccatt 
aaacaaaaca 
atgttccact 
gttaaaataa 
ctatagtgtg 
tctaattttc 
tgaacgagcc 
ctctcaatct 
ttcaaggtta 
cttttacaga 
tgagttgaaa 
aaaacacctc 
gaggttgaat 
actctcctcc 
ctttcaaaag 
acctccctca 
tcaccaggag 



gtgatcacta 
attttagctg 
catgcacttt 
gtaataagaa 
gacagaagag 
aagagcatag 
tactaggtag 
tatataaagg 
tgtaaaataa 
t tattattca 
gaataaaaca 
taataataac 
ataactcaaa 
tcctaaaaaa 
caaatcatct 
ctgctggaaa 
aaagctggag 
tttcagtttt 
ctcagcgtag 
gactcaattt 
cattaacaat 
acagtctctg 
ggaattaata 
ctcatgatat 
agatccaagt 
gttttgggga 
ctctatggct 
tcaaaaacag 
agaaatcaag 
ggagccaagg 
ggggaatagc 
taatatcagt 
accactaaaa 
aagaagggaa 
caaaagagtt 
ctggacactg 
gggaccagtt 
ggtggctcat 
tcaggagttc 
atacaaaatt 
ggtaggagaa 
gcactccagg 
aaacaaaaca 
ggtcataaaa 
ctcacagcaa 
caatttaatt 
acaataaccc 
aaatcaccta 
taaccacatg 
tcggaaaacc 
aagcaatcac 
tttttatatt 
agtttttatt 
cattaaagtg 
ataaaagcaa 
ccccactctc 
taggacatta 
agtttgtgga 



aaaatttcct 
tttcaatctc 
ctttattaga 
gcctgatgtg 
gcataaaaaa 
gctataaagc 
gtaaccctga 
ggacagtaac 
tttaaaacag 
tctaaacttt 
atgacctagc 
tttagtagtt 
taatttgcca 
gttctaatac 
gcatcaaata 
aagcaactga 
gaggaagggg 
caaaaatcca 
tagatagctt 
acctatttct 
attaatgcta 
agaaccatct 
gtttactgct 
cctctatgat 
tctactgttg 
agctgtctta 
ctaatattcc 
acttcgcaga 
gaagacttct 
ctattcccag 
atgcagtgtt 
ataaaactca 
tagttcatct 
taaatgaaga 
attccaaagt 
aaacagaaga 
agaacctcac 
gcctgtaatc 
aagaccagcc 
agccaggtgt 
tcgcttgaac 
ctgggcaaaa 
cagaaataca 
caaaagaata 
aattataatg 
tattatgtgc 
tattttacag 
gttacctgga 
ctatactgat 
tatgtagata 
tgatcatcta 
ttataaataa 
ctcttcccca 
gtgatatcat 
caagaacaca 
agaaaactgt 
tttgacttga 
aaatcagtgg 



aattgatgat 
ttcatattaa 
agaaaatgga 
tgtgaaaact 
taaaagtaat 
cagactggac 
gcaagtttca 
agcatttaac 
tacctggtat 
actttcatta 
ttagtaaata 
tgggataaca 
tcagatgatc 
ataacttttg 
gttcctactc 
agtcctagaa 
aaaaacatat 
cataggaagc 
agggcaat ca 
tttaaaaggt 
aagcagatga 
atagagatac 
tacagagaaa 
attatgtttg 
gctctgccat 
tt cccaaaat 
acagttacat 
aagaacatct 
tgaggaaggt 
gagttaacag 
atttggttgc 
acagaatgga 
agaagataaa 
cagttctggt 
attgacctgg 
agtagattat 
agagaagaac 
ccagcacttt 
tgacaaagat 
ggtggtgcat 
ccgggaggcg 
agagcgaaac 
tcaattaaaa 
caggaggcat 
atttaagtca 
caggcacaat 
attataaaat 
atataaactc 
gcatgtcaaa 
aaaatttcca 
ttgcaatact 
ttagaaagaa 
aatttcaaca 
cagtaatagc 
aaaattctca 
cattatttga 
ctcagagctc 
caattgttaa 



t aggaaaat a 
ggggagaaca 
ctgagggcag 
ggagaacagu 
gaacttaata 
tccctggatt 
atgaccaatc 
ccagaggaca 
tcaataaagc 
ccagcaat at 
aattcataat 
ctttgcatat 
tgttattttg 
ctctcatctt 
ttataacatg 
aatagaaatg 
ctgccaaata 
aatttaagcc 
aaacttgctg 
gtgtaagtag 
ttatcattca 
agagagaaat 
ctacatacat 
ctatagaaaa 
caaacaataa 
gaggaggtta 
ttgtcaaaac 
atatgatatg 
gacatctgaa 
agtcagataa 
agtctagcta 
gggagaaaaa 
ggacccatga 
ccattagaac 
taacttgaag 
gtatttggta 
tatgttaaga 
gggaggcct g 
ggagaaaccc 
gcctgtaatc 
gaggttgcag 
tcttgtctca 
aagtgagcta 
gacaagccat 
ataacatcta 
agtttattaa 
ggaggcccag 
agaactgcct 
gattcaattc 
aaataatcaa 
catgttctta 
tacatttttt 
aaatccattt 
agagtgagga 
aaatgaactt 
tctgccagtt 
actcagtgca 
acatcacatc 



actttctgta 


20520 


ttatgttttt 


20580 


taagcaaccg 


20640 


ctcaaatcai 


20700 


tatgaaaggt 


20760 


caaatcctgg 


20820 


tttttctcaa 


20880 


ataaggatta 


20940 


gcaataaatg 


21000 


tttttaatct 


21060 


gagaaaatgt 


21120 


tttaatttcc 


21180 


aagttaacaa 


21240 


atgttttaaa 


21300 


acaattgttt 


21360 


taattttaaa 


21420 


agcttataat 


21480 


t aaattgcct 


21540 


tgttgggctg 


21600 


gaaatatgat 


21660 


cgcattcact 


21720 


gaaacaatcc 


21780 


ggtgaaatat 


21840 


agaacaaggc 


21900 


gctaaacaat 


21960 


aattagttaa 


22020 


aaaaggtaga 


22080 


aagggctggg 


22140 


gtaactttag 


22200 


taaaagatca 


22260 


tattttagga 


22320 


gcaggtagaa 


22380 


gctaaatcag 


22440 


tgcaactcaa 


22500 


aaaagtaaag 


22560 


gtgaatggaa 


22620 


ccagaaatac 


22680 


ggtgggcgga 


22740 


tgtctcccct 


22800 


ccagctactc 


22860 


tgagctgaga 


22920 


aaaaacaaac 


22980 


ttcaccagat 


23040 


catcattgct 


23100 


ataattccag 


23160 


aggtattacc 


23220 


agatgtaagg 


23280 


aaatcaaaag 


23340 


attcagattt 


23400 


ggatatgtaa 


23460 


agcaatatac 


23520 


aaaactttaa 


23580 


atccaaactt 


23640 


ccctgaatat 


23700 


tttctgaaat 


23760 


ccctagaaaa 


23820 


aacaatttta 


23880 


tgccatgaga 


23940 
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tagcaataac 
aagaaatcca 
cacatgtata 
tatgggaaac 
cgtatcattg 
tactctagtt 
ccaagcagta 
ggaaagaaac 
atctggtttc 
aaattacaaa 
gaaactggcc 
attttaaata 
agaacaatat 
tggtctagaa 
tactcaacac 
aaatagaaat 
ttgaaaagca 
agaatgaatc 
aaggaaggaa 
aatgagaggc 
ctaaacttcc 
aaaaagaata 
taaagagaga 
caaatttctc 
gaaagaagta 
gggtggccaa 
aaagaggctc 
tagtcccagc 
tgcagtgagc 
aaaaatgtca 
tgaagctctg 
ggaatgtaag 
ttgcactgtt 
cagaacagga 
aacttgaagg 
gcttaaggta 
ctaatctaac 
aaaaaacttt 
ttgggctacc 
atcttgcaac 
ccatccacca 
tctagcaggg 
ggctaaagac 
gaacactagt 
taacactcac 
ggtcagagaa 
ctgggagcaa 
catgaaggga 
ccttagaatt 
cgccagactt 
cccttctggg 
ggaagccaag 
ttgagatcat 
cttcccttct 
aaaattctcc 
tgagactttc 
tgcgccctta 
tttaggtata 



agatgggaca 
aagggggtct 
gagctgtgta 
cctgaggctc 
aaggcaatgc 
ctaggcattc 
actttagggg 
taaacaagca 
cagagttatt 
gacatgcaaa 
ctgaaaaaga 
tgcgcaaaga 
ttctgatcct 
cttcttaaaa 
aatgttgtgt 
tatagagata 
caaaaactga 
agcaaatcta 
aggaggctca 
ccagaagaag 
cgaacttgac 
aaatcaaagc 
ctctcaaaac 
atcagaaatg 
gaatgtctgg 
ggtgggagga 
tgtctctaca 
tactcaggcg 
tatgactgtg 
accaaaaact 
aaggtgctta 
aaaattaaga 
ctggttattg 
tataaaatct 
agaaggaata 
aaacaaacag 
aaggaggggc 
caggagtttc 
ctctttgggt 
tgcactcttc 
ctgctgtttg 
tgtccgttgt 
ttgccattgt 
cactgggttc 
cgcgtggccc 
cacgaggctt 
ggaccccctg 
tctccaaagc 
ggaggaaaat 
tagactcagg 
ttgggaacct 
ggctgactag 
gtcgcagcca 
gtcccacacc 
ttacctctga 
atttcctcta 
ggcatctagg 
cagctctaga 



aacaagctaa 
gaaaagtt ct 
cacgctcaaa 
tgtacaagaa 
cccaacattc 
aagaaaatct 
cctgtgtgat 
acagcaacaa 
ctgttatact 
gaaacaagta 
ccagatgct g 
actaaaaaaa 
tcagaagaac 
acagaatcat 
gagatttatc 
aataggagtt 
attaacttga 
aagataggtc 
gagacccaag 
atgcagaaaa 
cccaaaaatt 
gatccacacc 
aggcaaggga 
atgttgtcaa 
gacctggaat 
tcacttgagg 
aagaataaaa 
gctaaggtgg 
ccactgcact 
acatgcagaa 
agactgtaga 
cagccttgtt 
tcaagctatg 
tatcaggtaa 
aggaaccaac 
ggaaataaaa 
ttaaactgat 
accagtccat 
cccctccctt 
tggtccgtgt 
ccgccatcgc 
gctcctgatc 
tcctacgcgg 
cacggttctc 
aagattccat 
gccatcatct 
gtaacaattt 
ggtaatattg 
actgggcacc 
tatgaggcta 
tggtctgcct 
aggcagaaag 
gaagtctcta 
tcctgggtcc 
atctacttcc 
gcaagttgta 
ctataaaccc 
catgggcagt 



ccaaaaaatt 
aacatatttc 
aaacatctac 
gaaagtaaaa 
acacataggc 
cttctaatca 
aaaaaataaa 
caaaaacaga 
atataaaata 
taagccacaa 
gacttactgg 
agtttatcta 
cactttttgt 
agagtatatt 
catgttgttg 
acaaaaaagt 
ggggctcaac 
aattgcgaga 
agacaccatc 
agggtcagag 
aatctacaca 
t aggtacatc 
cttatgtaca 
taggcaatca 
gctggtggac 
caaggagttg 
agattggctg 
aaagatcgct 
cttgcagtgg 
aaactgcact 
tcaataccat 
tgataactac 
agcacaaact 
agttaggcaa 
tcaaaccagg 
caactcagaa 
tattttacag 
aaactatttg 
tgt atgggag 
ttgttacggc 
aggcctgcca 
cagtgagacg 
ctaagtgccc 
ttctgtgacc 
ttattggaat 
tagaagcagc 
ggcgaccaca 
gaccactttt 
tgtcggccgg 
tctggggaag 
ggagccagct 
ctgtcgtccc 
ctcaacagtc 
caaccacgac 
tctgatccct 
tctccaaagg 
agggagtctt 
tatgtgggac 



aaaagaaaaa 
tgataatcca 
gaaggcccta 
tccagttara 
ccctggcaaa 
tcagatgatc 
aacctgaaag 
ccttgggaaa 
ttcaggtctc 
actgggggga 
acaaagactr 
aagaactaca 
cactacagat 
ctcttt atat 
catgtatcar 
accaaacaaa 
agctgatttg 
aagagaggga 
aggcatacca 
tatctgaaaa 
tccaagaaga 
ataat caaat 
aaacat cttc 
gatgacataa 
acctgtaatc 
aagaccagcc 
aatgtggtgg 
tgagcccagg 
agaccctgtc 
t caagaaatg 
agaaaataat 
acataatact 
gatgactgaa 
gcaattacta 
cagcaatgaa 
cctaagcata 
cttgggtgca 
gttattagaa 
ctctgttttc 
tcgagctgag 
ctgacttcca 
cccattgccg 
gggttcatcc 
cgtggcttct 
ccatgaggcc 
ccgccaccat 
aagggacctg 
gcttgctact 
ttaaaaacga 
ggctttctaa 
tccactttca 
gaactcccgg 
gcccatgcgt 
tttcttgaaa 
gcctcctagg 
gatctaagga 
gtccctggtg 
ctgttcccca 



cctgggaaat 
gaaagccata 
aactctcacc 
aattgcttgc 
gattggaaga 
actaaactca 
aattagttca 
ggggggaagc 
aacaacaaca 
aaaagcagca 
taagagagtr 
ggaaagtatc 
tagttctgr c 
cagctctttz 
t cccaaacag 
aattctggag 
ggcagccaga 
agaaggaagg 
atatacatar 
aataatggcc 
taaacaaacr 
gactgaaata 
agatt aataa 
tcaaagcacr 
tcagtatttt 
tgggcagcag 
tgtggacctg 
agttggaggc 
tctataaaga 
atcagtacct 
ttagtattta 
gtaactgttc 
atacagaata 
gttgtaattc 
ttgtaaaaaa 
tcgt aagaac 
attatcccac 
aatagcttta 
act ct attaa 
ctttcactct 
tccctctgga 
atcccgactg 
taattgagct 
aatagagcta 
aagaacccca 
cttcggagtt 
aacccgcaac 
ctggcctatc 
ttagcatggc 
caaccctcaa 
attttcctgg 
cattagccgg 
gcgctcctac 
gtgtagcccc 
tactaatggt 
agctctatgc 
tccct cctga 
ccacccttgc 



24000 
24060 
24120 
24180 
24240 
24300 
24360 
24420 
24480 
24540 
24600 
24660 
24720 
24780 
24840 
24900 
24960 
25020 
25080 
25140 
25200 
25260 
25320 
25380 
25440 
25500 
25560 
25620 
25680 
25740 
25800 
25860 
25920 
25980 
26040 
26100 
26160 
26220 
26280 
26340 
26400 
26460 
26520 
26580 
26640 
26700 
26760 
26820 
26880 
26940 
27000 
27060 
27120 
27180 
27240 
27300 
27360 
27420 
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cagggcccca 
cagtgagaga 
ggaggacagg 
gagacaaaca 
tgccctattc 
tctccgcgac 
ctgaaaacac 
gtgacctgcg 
aaaagtagaa 
attattctaa 
ggctattctg 
agatttcctt 
aggaactccc 
acaatgggta 
ctaataattg 
taccgaatca 
acgaatttgc 
tatgaaatac 
ttgggcacgc 
aagaaaggcg 
cagaggtcca 
gctctaggac 
ttcagatagg 
gggaccaatt 
tggcaacgat 
aacaccatct 
tacgtacaaa 
tgccctacag 
ccaaataata 
aacaactaac 
gaattcggcc 
acctaggtaa 
aatcctttga 
atgacagaag 
aggtcaatga 
ttcccagtgt 
atttgctaac 
caatgatgtc 
taacggaggc 
aatcttaaag 
gtctgcctta 
ttataataga 
cgctttagtc 
ggcaaatcaa 
agattgtcca 
ctgtaaggcc 
gatccagcag 
agagccctgg 
tgtggccttc 
ccaaggggtc 
gggaacttca 
agggagagac 
gtttgttgtc 
tatggacgag 
ccccaccaaa 
gacctaaaag 
ggagtacaga 
gtcactgtcc 



agtt tgtaaa 
cagacagaga 
gagagagaca 
gggagtcaga 
ctttaaaagc 
cctataacac 
taagaccact 
gatggcccaa 
aagtaacttt 
gtcaaaaaag 
tcagaaaaag 
acaggggatt 
tt caggacag 
ttcagtaatt 
gtctcctcaa 
aaaagactat 
ctaagaactg 
tcaggaactc 
tggtaaagga 
ggaaaagggg 
tgggtggtta 
taatgctcat 
aaacgttccc 
tgactctcag 
atactcttta 
tacagctaga 
ctttcttttc 
gaagccctca 
aggacccccc 
caaagaatgc 
cagccagagt 
attctcagat 
tctgatatgg 
tgtcgccgta 
taggtcgaca 
agaccctcac 
ttgcgtgcta 
cactataaca 
attgaggaag 
gataagttta 
ggcccggaac 
gatcaggatg 
atggccctca 
atgcctaata 
aatagaaata 
cactgcccca 
caggactgag 
gtatgcttga 
tcagtcttat 
ctaggacagc 
ctcttttcac 
attctagcaa 
ccctgcttga 
caaagaatgc 
ggcagtaccc 
cccaaggcct 
aacccagtgg 
ctctatacct 



tggctaagag 
cagagagaga 
gagaggagag 
gaaagaaaga 
cagggtaaat 
tccaatacta 
gacaacccat 
atgcattcaa 
tagaggaaac 
caaaaaggta 
gtaatttaac 
taaatcttaa 
gatgatagat 
gatagggaga 
atgtcagagc 
ctcaatcctg 
ttgtttatgg 
agcctagctc 
ccactagaat 
tgagggctgc 
cacaccccgg 
cggaaaatga 
ctcaaggcaa 
atgctaagaa 
agggggagaa 
cctcttttgt 
attaagagac 
gagtctacct 
ttcaacccaa 
caatattccc 
gcacgtacct 
aaccctaatg 
agagatataa 
actgcagcct 
acagaggaaa 
tgggacacag 
gaaggactaa 
cagggaaagg 
catacctct c 
tcactcagtc 
aaaacttaga 
agcaggcaga 
ggcaagcgga 
gggtttgctt 
agccgccccc 
ggggacgtag 
agtgcccggg 
ccattgacgg 
tttcctgtcc 
cagtcactag 
atgcttttct 
aagcaggggc 
ggaaggaatt 
ccgtcctgtt 
ccttagaccc 
agtaaaagca 
acagtggagg 
agctgtacct 



aggaaacaga 
gagagacaga 
ggagagagac 
caaagataga 
gtaaaaccta 
ccttgttgtc 
agccttccta 
tctgtagcgg 
ctcattgtga 
gcttattaac 
actaaccact 
ttaccataca 
ggttcctccc 
ctcttgtgga 
tgtttgcact 
actcaaaagc 
gaatgcatct 
taggactcac 
ccagcagccc 
tacatcagtg 
aaaggaataa 
ctagtggtgc 
aaacacccct 
aaaaaagaca 
acctggcatc 
agaaaagaag 
aactcgcaat 
ccctacccca 
acggtccaaa 
cgattatgcc 
ttttctctct 
gctatattga 
tgttactgct 
gagagtttgg 
gagaacgatt 
aatcagaaca 
ggaaaactag 
aagaaaatcc 
tctgtcaact 
agctacagac 
aaccctattg 
atgggacaaa 
ctttggaggc 
ccagtgcggt 
tcgtccatgc 
gtcctctgag 
gcaagcacca 
ccaggaggct 
cagacaacgg 
atacttctcc 
aattatgcct 
cattatacac 
aatcttgaag 
caagttaaac 
gaggctcaac 
tgcaatagcc 
ttagtgcaag 
aacccttata 



gagagacaga 
gaggagagag 
aaagaggaga 
aatagtaaaa 
taattgataa 
agcgtaaaca 
tcaaaaatcc 
caactgcttt 
gcacacctca 
tcaaaaatar 
gataattccc 
aaggtccgac 
aaatgactga 
agcagagtta 
cagccaagcc 
ttacttatac 
tgatggagca 
ccctgagcac 
ggaccccttt 
agcataacta 
gcattaggac 
tggcatcccr 
aagatgtatt 
tattcttctg 
ctgagggaag 
gcaaatggtg 
tatgtaaaaa 
gcatccccca 
aggagataga 
ccct ccaagc 
cagactttaa 
tgttttacaa 
aaatcagaca 
cgatctctgg 
ccccacaggc 
tggagattgg 
aaagaagcct 
taccgccttr 
gactctactg 
attaggaaaa 
aacttggcaa 
tgggataaaa 
actggaaaag 
ctacaaggac 
acctcgtgtc 
tcagaagcca 
gcccatgcca 
aactgtctcc 
tcctccagag 
cagccactaa 
gaaagcccaa 
ctgaacatag 
actgggcaac 
taaaggattc 
aaggactcca 
cctacaataa 
atct caggat 
ttctgctttc 



gagaaagaga 
agagagacag 
aagaggcaga 
aaaaacagt g 
ttgaaggtct 
agggcgragc 
ttaacatcca 
gctaacagaa 
ccggttcaga 
taaagtatgg 
ttaaccctgc 
cagacctagg 
ggaaaaaacc 
gaaaaattgc 
ttaacgtact 
ccrct ctgaa 
gctgggttgt 
aaaggcaatg 
ctttgtgatc 
at ccgataag 
catagaggac 
atgttctttt 
ctggagaatt 
cagtaccgcc 
cataaattat 
tgaagtgtca 
gtgtgattta 
gactccttcc 
caaaggggta 
ggtgggagga 
attaaaatag 
ggtttaggac 
ctaaccccaa 
tatctcagtc 
cagcaggcag 
tgccgcagac 
gtgagttatt 
ctggagtgac 
aaggccaact 
aacttcaaaa 
cctcagtttt 
aaaaggccac 
ggaaaagcta 
actttaaaaa 
aagggaatca 
ctaaccagat 
tcaccctcac 
tggacactgg 
ctgtcactat 
gttgtgactg 
ctcccttgtt 
gagaacaccc 
agaaggacaa 
tgcctccttt 
aaagattaag 
tccaacttta 
tatcaatgag 
ccaaatacca 



27480 
27540 
27600 
27660 
27720 
27780 
27840 
27900 
27960 
28020 
28080 
28140 
28200 
28260 
28320 
28380 
28440 
28500 
28560 
28620 
28680 
28740 
28800 
28860 
28920 
28980 
29040 
29100 
29160 
29220 
29280 
29340 
29400 
29460 
29520 
29580 
29640 
29700 
29760 
29820 
29880 
29940 
30000 
30060 
30120 
30180 
30240 
30300 
30360 
30420 
30480 
30540 
30600 
30660 
30720 
30780 
30840 
30900 
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gaggaagcag 
catcctgact 
acctggactg 
gcccaagact 
ttttactttt 
attttctcgc 
aggttaaata 
gcttatcctc 
tgccaaatat 
gaaactcaga 
caggccctaa 
ttttctttac 
tgagcttgca 
ctcattgttt 
tacaaggaag 
agacttgtgg 
ctcccttatc 
cctccatgct 
cttcccagaa 
actgcccaca 
aatactcatt 
actgtctgtc 
caggcaagag 
cctagcccct 
tgcctggtaa 
cctactaact 
cctgaacaat 
cttgtttcca 
actgtagaca 
tgcctaccct 
tcttcagaat 
aagatttata 
ttgttatcgg 
ctactcagtt 
actccctggt 
gaagagcttt 
aatgttgtta 
ttgtcacaga 
aaaaacacca 
ggatctctag 
gttaagtttg 
ccccagatga 
tgctccaatt 
ctactatgcc 
gcacttgggt 
gccgactaag 
gcttgcaact 
attagacaaa 
gaaggacaat 
ggtcccctcc 
aaaaaaaaaa 
atacagttca 
gcatttccat 
tacaccctcc 
tattagtttt 
tattggttct 
tattcctttt 
ttacctgttg 



agtggtttac 
ct caattctt 
t ttcacccca 
tgagccggtt 
agccgccagt 
tacctgtggc 
cttagggcta 
at cccaaaac 
ggattcccag 
aagccaatac 
agaaggccct 
atgtcacaga 
acccatggca 
atgggtagtg 
agatctgtgt 
ctgt cagaca 
atatttttct 
gctgtacaac 
atattgatgc 
cccatatgcc 
attggacagg 
ggacttactt 
aaaaacatgt 
acaaaggact 
gcctatttaa 
gttggatgtg 
ggaacaacta 
at ctggaaat 
caaccaactc 
caggaatatt 
ctatgtgctt 
caattatgtt 
agcaggagtg 
ctactacaaa 
caccttgcaa 
agacttgcta 
ttatgttatt 
gaaagttgaa 
gaccctgggg 
cagctctaat 
tctcttccag 
agtccatgac 
gtaatgatat 
ccaattccgc 
tttcctgttg 
aatcccaaag 
tagctcacac 
aacaggaggt 
gatcgggata 
ctttgtatgg 
tagcttaatt 
aactgtaaca 
catgccctaa 
tgacctggcc 
gtctgttcta 
ttttactcaa 
aatcctgaat 
acagatatct 



agacctggac 
atttgccttt 
agggttcagg 
ctcatacctg 
tcagaaacct 
tacaaggttt 
aaattatcca 
cctaaagcaa 
gtacggcgaa 
ccatttagta 
aacccaagcc 
aaaaaacaga 
tacctgagta 
gcggcagtag 
agacatctca 
accgtgagga 
ctttactgtt 
cagcagctcc 
cccatcaaat 
ccacaactgc 
gaaaatgatt 
cacccatact 
aaaggaagta 
agatctctta 
taccaccctc 
cctccccctg 
cagcacagaa 
aacccatacc 
ccaatgcatc 
ttttgtctgt 
cct ctcattc 
gtacctaagc 
ctaggtggac 
ctatctcaag 
gatcaactta 
acctctgaaa 
ttagcggaag 
gaaattcgag 
cctcctcagc 
attgatactc 
aatcaaagtt 
taagatctac 
cgaacgcacc 
aggaagcagt 
agtgggggga 
cctagctggg 
ccgaccaatc 
aaaaaaatag 
taaacccagg 
gagctctctc 
gaagaataaa 
gtgttacagt 
aagttccttc 
cagaccttgg 
gaacttctta 
tgtaatgttc 
agtatgctgt 
gagctattat 



cttaaggat g 
gaagatcctt 
gatagccccc 
ggcactcttg 
tgtgccatca 
ccaaaccaaa 
aaggcaccag 
ctaagaggat 
atagccagac 
agatggacac 
ccagtgt tta 
aatagctcta 
aggaaattga 
cagtcttagt 
taacgtgaac 
aagtaactaa 
ctcttacccc 
ccttaccaag 
aggagt t t ac 
tataactctg 
aatcctagtt 
ggtatgtctg 
acctcccaac 
aaactacatg 
actgggctcc 
tatttcaggc 
ataaacacca 
tcaaacct ca 
aggtgggtaa 
ggtaccttag 
ttagtgcccc 
cccacaacaa 
taggttctgg 
aactcaatgg 
acttcctagc 
gagggggaag 
aatgttgtta 
attgaataca 
caatggatgc 
ctctttggac 
gtaaagctac 
cgtggacccc 
cctcccgagg 
tagactggtc 
ctgagagaca 
aaggtgacca 
aggtagtaaa 
ccaatcatct 
cattcaagcc 
tgtcttcact 
ttaatacaat 
ttcaagagga 
ttgtccctta 
cctcagaaga 
aaaacagaat 
tgtgacattt 
tttaggaata 
gatggatatt 



cctttttctg 
caaacccaat 
atctat t tgg 
tcctttggta 
agtcacccaa 
ggctcagctc 
ggccctcagt 
t cct tgacat 
cattatatac 
ctgaagcaga 
gcttgccaac 
ggagt cctt a 
tgtagtggca 
atctgaagca 
ggcatactca 
aatcgtaaat 
ctttcactct 
agttt ctatg 
ct aaaggaaa 
ccactctttg 
gtcctggaag 
aggggggtgg 
tgacccgggt 
aaaccctcca 
atgaggtctc 
catgcatttc 
cttccgtttt 
cctgtgtaaa 
ct cct cccac 
cctatcgttg 
catgaccatt 
aagagtactc 
cattggcggt 
tgacatggaa 
arcagtagtc 
ctgtttattt 
ttatgttaat 
acgtagaaca 
cctggatt ct 
cctgtatctt 
aaatcgttct 
tggaccggcc 
aaatctcaac 
gtcagccaac 
ggattagctg 
catccacctt 
gagagct cac 
atcgcctgag 
ggcaacggct 
ctattaaata 
aaaaggaata 
ccccttcaac 
ctggttgggt 
atcatttttt 
catagagtat 
atccatatta 
taatgcaatt 
atgaataat t 



catccctgta 


30960 


gtctcaactc 


31020 


ccaggcar r a 


31080 


tgtggatgat 


31140 


gtgctcttaa 


31200 


tgctcacagc 


31260 


gcctattctg 


31320 


aacaggtttc 


31380 


act aattaag 


31440 


agcggctttc 


31500 


ggggcaagac 


31560 


cacaggt cga 


31620 


aagggttggc 


31680 


gttaaaataa 


31740 


crgctaaagg 


31800 


ccccatggcc 


31860 


cactgcaccc 


31920 


aagaatgcgg 


31980 


ct ccaccttc 


32040 


catgcatgca 


32100 


acttggagcc 


32160 


agttcaagat 


32220 


acatagcacc 


32280 


tacccatact 


32340 


ggcccaaaac 


32400 


aatccctgta 


32460 


agtaggacct 


32520 


atttagcaat 


32580 


acgaatagtc 


32640 


tttgaatggc 


32700 


tacactgaac 


32760 


attcttcctt 


32820 


accacaacct 


32880 


tgggttgccg 


32940 


cttcaaaatt 


33000 


ttaggggaag 


33060 


caatcctgaa 


33120 


gaggagctt c 


33180 


ccccttctta 


33240 


taacctcctt 


33300 


tcaaatggaa 


33360 


tactagccca 


33420 


tgcacaaccc 


33480 


ctccccaaca 


33540 


gatttcctag 


33600 


taaacactgg 


33660 


taaaatgcta 


33720 


agcacagcgg 


33780 


accttctttg 


33840 


ttgcaactgc 


33900 


cattttaagt 


33960 


aagatattgg 


34020 


ccatctctac 


34080 


tgtcactaca 


34140 


gttctctttg 


34200 


ttgcatgtat 


34260 


gtttattcat 


34320 


crgctatgaa 


34380 
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cacttctgta caatgttttc tcggacatat attttcattt ttctrgagtg gagctgttag 34440 
aactgttgga tcagaaagta agcatatgtt gaattttgaa agaaactggt aaactcttgt 34500 
ctaaagtgat ttgtaccatt ttacactcct actaataatg tatgagagtt atacttgcnc 34560 
cacagccttt ttactacttt gttaatcttt ttagtactgr caaccttttt aatttatcca 34620 
atctagggaa cgtgaagtag tatctcactg ttattttcat tttcctgatg agtaacaata 34680 
tcgtgtatct tttcatgtgc ttattagcca ttcctatatc ttttgtgaaa tagttaactr 34740 
aaatttgtaa ctaaaggtgc tttcctgagt ttcaggtagt aagcctattt ccctcaagtg 34800 
aataaactac agtcttggaa tgaaaaatta aacacagtgg agacattttt tgtataagtt 34860 
gttttactct gtgtatgtct ggtttgctta gtctattatt atatgcccca tgaaagcaaa 34920 
cacagtgctt atttcactaa tgagtatcac tagcacatag aactgtgctt gcccaaagca 34980 
tgaactcaat aaatatgtta atgtgtatgc atgcacatac atctacatgc atgtacatct 35040 
atacacacat ataaacatat attaattttt agacccacaa atctaagaaa actaattctt 35100 
gagcctctgg tttgaagaat tctcaaatta ttaacatatc tttatgttcc actccacatc 35160 
cactgtacct gaaatagccc tactgttcta ctttggtaaa tcaggcaaat ttaatttttt 35220 
aaataattaa gattccaact aattttaaaa tataatttga aagttaacaa tgaaataca: 35280 
tacataaaaa gaaaatttta aataaaagca aaactaaacc caataagagg aaagaaagt~ 35340 
gggctgtatt tctttaatcc tttaaaattc aaatcacaca atgctccaat gaaatctrca 35400 
ttaactgaac caaactatgc ccatgaaaga tctcatatgc aactgctaaa acctcaataa 35460 
acatattcat cttcttgcaa aaaagatatt tctttataat atgcacatgc agtatatacr 35520 
attttgaggc agatttgtac tttagtcctt gttccattgc ttaccggctg gctgtcctrt 35580 
gtctggtcat tgacctccaa cttaaaaaat aatacttgcc ttgtctaccc cacagaagtg 35640 
ttatgaaagt caaacaaggt agcataaagg tattttacaa gatataaagt gctataatac 35700 
agattttaaa aatcactcta catcccataa tactttgttg tacaatttta gagcaatagt 35760 
agaaaataac aattattgcc taattgaaaa tccagtcccg aattccataa aatgtatgat 35820 
atgaacatta tagtacatca tattacgagc cccaaataat cactgcttat atagttggtt 35880 
aggatttcct tagtttgttc atatagttta tatatttatg cagtccctat tttgtgagag 35940 
gcattgtgag gagcataaag acataagcac agtacagagc cttagcttct ctacatttac 36000 
taaagaagac ttcttcttgg gtatttaatc aatatttaaa gtattctggg aagaaatgaa 36060 
attaacttca tagactgacc ttagattact atcattacaa aaagatgcct gagtgatctg 36120 
tctttaacat accagtattt atcttataac tgttatattt acttgaatca gaagtgaagt 36180 
ccttttaagc actaagcatc cattctatac tttcttgtct ttacatatga gatacaaatc 36240 
atatttttaa aacttttatt tacttttatt ttttagagac ggagtcttgc tctgtagccc 36300 
aggctggagt acagtggcat gatcttggct caccacaatc tccacctcca cttcccaggg 36360 
ttcaagtgaa caaatcatac ttttaagcac agattctcaa catgtatcct agcatgctac 36420 
tgccataact agggtgtgaa ttaagtatta aagacagctt accccaaata ttactgtaac 36480 
atatatctct aaatgaaaaa gaacatatta acaactatac ttggatggga ttctgggagc 36540 
taacccatcc ctctctcccc tttcctccaa attccatctc ctattaacac accagctctc 36600 
ctgagctaag cagctcctgg ggttggggaa gggtgtacat ggagaaagct agaacctcta 36660 
cagtgttttc ctctctggga ggaactagca ggcatacgaa cagaaaaagc tgaataaaag 36720 
gctgaatcct ttctattcct gaggcagaca gagagaagac cagggaacaa agagacttcg 36780 
accaagagcc ctgccaggta ttgatacctt tgatactgag aaaatatctg ggatatgaaa 36840 
tacaaatgct aaataagtat ctttgaaata ggggtaaaag aataaagggt cttgatgagt 36900 
aaaatgggta gtatttttta ataacctgat aatgagcttt aggaaaaggg aaggtcaacg 36960 
ttatggaatg aaaacacaga ggtaccaaat ttaaaagcat aaaaaaaagt ggaggggggg 37020 
aacccaataa cttcatcaaa ctagcaaata acttagtatc atttctaatt agaaacgcta 37080 
gaaggaaatc acttagatct gataaagact aggctataat tctaactgat gaaacactta 37140 
aactgtatca attaatacca gaaaacaaac acagaaaagt ctactagaac catcattatt 37200 
cagcacagtc ttggtaatgc aatactataa tagcaatgca ataaagcaag aaaaaaaaaa 37260 
gtttgtaaaa acacaatagg atgagatttt tgtttttcca atgccataaa taactagaaa 37320 
tggaaacaaa ataaagaaaa acaaaatcta caaaacacct ggaaataaaa agaaaaatgg 37380 
tctatttgaa gaaaacctta aaatctatgc agaacataaa acaaaatctg aataaaaaga 37440 
aatatcatgt tcttgtctgg gaagacttaa tatcataaga aagtgaatta tatcaaaatt 37500 
taaatcgaaa tttaatgtat ttccatctct aatcagacag gacactatgg ggaactgaat 37560 
aagtgatttt aaaagtcatg gaaaattaat aactgagaat aaccatgaaa agtatgaaaa 37620 
aaggagacaa atgaattgct ccaacagata tcagaacgct aaaattaaat aaaaatacta 37680 
ctaggataag aaaatacata tactgatgta atgaataaag aatccagaat tagattccag 37740 
taagtcaaac tactttacta taaaccaggg gtggcatatt catccagtgg gaaaaggaca 37800 
gtaagaagtg agtaaactat ggcccactgg ccaaattgtg gcctctgcct atttttgcaa 37860 
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ataaagtttt 
atgttacaga 
actatctggc 
tctcatagac 
acggggtctt 
cctcaacctc 
tgtgtgccac 
taagaaaaag 
tcaagatgaa 
taaaaattat 
ataaaattat 
gcaatttaca 
ctaagtgtga 
aaaaatcaga 
atatactgtt 
ttttaatctc 
aaaaatacat 
cttgatagtg 
taaaaaagaa 
aggccaaagc 
aaaaccctgg 
tcccagctac 
agtgagccaa 
acaaaaagaa 
aatgggcaaa 
tgcagagcac 
acagaaaata 
gggaatgtaa 
aaataaaatt 
aacagggtgt 
atatttgttc 
atttaaattg 
ctactcagtt 
gcaacagact 
accctggctt 
caaaaccagg 
ctaccaccac 
ggcagcatta 
aaaatgtggt 
ctatctatat 
ttcaccatgt 
cttcccaaag 
ctgacacata 
tcacaaaaag 
cataaagtag 
agaaaagagt 
tggttaagat 
ataatattaa 
cattcacctg 
ttattacaaa 
aatattcagt 
gttattgcaa 
atcaacatcg 
catatttcta 
gagtctaaaa 
agtttccatt 
atttttagca 
aaagaattaa 



actgggacaa 
atcacacagt 
ccttgaagaa 
acctatctca 
gctctgttga 
ccaggttcaa 
tacgcctggc 
aagggcatat 
ttatacagtt 
tttataaaat 
tttataaaat 
gaaaaccaag 
gagaattatt 
gttataatgc 
agtgaaaatt 
taccttttga 
atgcttactg 
aatactgaac 
taaattaggc 
aggcggat ca 
ctctacaaaa 
tcaggaggct 
gatcatgcca 
caaattaaac 
ggacttgaat 
tattcattag 
ataaatattg 
agtggtacag 
atcttatgat 
acacccattt 
aaatattctt 
gtggattctg 
gaaggtctta 
gcctttggac 
ggtgagtcca 
aaagccaatt 
caccatgatg 
ttcacaatag 
atgtatatac 
ctatacacac 
tgtcaaggct 
tgctgagatt 
atacaatata 
gcaattagtg 
aatggggaaa 
tttggagaat 
tataaatttt 
ggaaaaatac 
ggaaacagaa 
tgatgttgtg 
ttactaacca 
gatatctact 
ctaaaaccct 
ctgtcctcac 
tttggctcct 
ttcaaaaatg 
catagaagtt 
aatattaatg 



agccaagcct 
ttcaacagag 
agtttgccaa 
cacaacacat 
ccaggctgga 
gtaatgctcc 
taaggggcct 
ttgatatata 
atattttgca 
atctttaata 
aaaaagttaa 
tccaaatggt 
agttaaagta 
cctattgctg 
taaactaata 
tgcaaaaact 
tagtactgtt 
aaattacagt 
tgggtgcggt 
cttgaggcca 
aatacaaaaa 
gaggcaggag 
cagcattcca 
cctacaactc 
agacatttct 
tgattacatc 
gtgaagatct 
ctactacgga 
aggaatatgc 
caacatttac 
ctggatgctt 
agtacagcag 
cagaaaaaga 
tcaactgcaa 
gggtctgatg 
cattaaaata 
gttctgtttc 
ccaaaaggtg 
aatggaatat 
atactcacac 
ggtctcgaac 
acatgtgtga 
gataaacaat 
tatgattcct 
cagagagttg 
gaatgtacaa 
atgttacatt 
tataaataac 
tacatcctat 
tatctttttg 
gtaagtcctt 
aaaatggaaa 
ggaggggaag 
ttttcaaaat 
tcttcagttt 
tactttttct 
aaatagattt 
gcgctttaat 



atcatttgca 
accatcttgt 
accttagttt 
tgtgggaaag 
ctgtagtggc 
caccacagaa 
ttttaacaga 
tttatatttt 
atgtgtttga 
tatttataga 
gaagaaaaga 
caacaaagat 
aaaatatctc 
gtggagatgt 
catttttgaa 
catttttggg 
tataatggta 
gcatctacag 
ggctcatgcc 
ggagttcgag 
ttagtcgggc 
aatcacttga 
gtccaggtga 
atcaacaaaa 
tcaaggatga 
ccacatgcat 
gaaaaacaga 
aaacagtatg 
atttctgggt 
atgtcaattc 
ctatatatat 
attaccatcc 
ctgacctccc 
ctcttccttg 
aggtaggctg 
aatctctctc 
tctggagaat 
gaagcaactc 
tattaagcct 
acacacacac 
tcctgggctc 
gccaccacac 
gaggacatca 
cttgtatgag 
tttaatgggt 
cagtgtgaac 
tattttacca 
aacaacaaaa 
tctgctagag 
aaatgactga 
ctttcatggt 
acaactgaaa 
aatcctaaca 
ccagaaatca 
agaaggtgcc 
ctccccaaac 
gcttaaccaa 
gatacaaatg 



aattgtctat 
ctacaaagct 
at ataataaa 
gaccttcttt 
atgatcatgg 
tcccaaacag 
gaaagaaatc 
ttatatagat 
cggtaaaagt 
tattataata 
taggcaaaac 
aaaacagatt 
tctataccca 
aaggggagaa 
aagtaagctg 
tacctattcc 
aaaactagaa 
attaaacata 
cgtaat ccca 
accagcctgg 
atggtggtgg 
gcctgggaga 
cagaacgaga 
atacccaaac 
taaacaagca 
taggatggct 
aacctttgtg 
gccattcctc 
aaatacccca 
aactgggcca 
gttttttggc 
acaatgtagg 
ttgagcaaga 
agtcaacagc 
cagactcaag 
tacacaaaca 
gctaatacac 
cagcagatga 
ttaaaaagtg 
acatttatag 
aagcaaaccg 
ccagccaaaa 
tgatatgcga 
gtacctatgg 
atagagtttg 
ataattaaca 
tgattaaaaa 
aaaacacct c 
atatatctgc 
aaaactaaat 
tcctgacttt 
aggcaaaatt 
aacatggcca 
acatttctgg 
aagttaatcc 
cggtatctag 
aatagccagt 
aacaacttta 



aaat at t tt c 


37920 


gaaaat ate t 


3^980 


agat cagcta 


38040 


tttttttgag 


38100 


ctcactgcag 


38160 


ctgggagaga 


38220 


cacatactac 


38280 


atcataaaaa 


38340 


ttaatatcta 


38400 


taaaatatct 


38460 


aaaatacag" 


38520 


tataaactca 


38580 


caatactact 


38640 


gcatgctctc 


38700 


gcaatttttt 


38760 


ataccttaaa 


38820 


aaaaagaaaa 


38880 


atgeagecat 


38940 


gcacttt ggg 


39000 


ccaacatggc 


39060 


gcacctgtag 


39120 


cagagattgc 


39180 


ctctgtctca 


39240 


ccaattcaaa 


39300 


catgaaaaga 


39360 


agtatgaaga 


39420 


cactgttggt 


39480 


aagaaaataa 


39540 


aataactgaa 


39600 


gaatacccag 


39660 


tgaggttaac 


39720 


tgggectcat 


39780 


aagaattcag 


39840 


ccatcccatc 


39900 


gaagagctgc 


39960 


cacacacaca 


40020 


ccctgttcat 


40080 


atggagaagc 


40140 


gaaattatat 


40200 


aagacagggt 


40260 


cctgcctcag 


40320 


aaaggacatt 


40380 


aataagcctg 


40440 


atgtcaaatc 


40500 


ttttgeaaga 


40560 


ctactgaaaa 


40620 


ttaaaacaaa 


40680 


aagcaactta 


40740 


agttcaaaat 


40800 


taaaagcaat 


40860 


tctgtaagat 


40920 


ataatttctt 


40980 


taatttgeca 


41040 


aaacaaaaca 


41100 


ctgacatcct 


41160 


attcttaaat 


41220 


aaacctccca 


41280 


cattcaatcg 


41340 
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tcaatgggaa aggaagcaga attctgagga ttatgaaagt aaacaaaacg aagttcaaa: 4I40G 
tctactttat tttacttttt tgtaactaat gaacaacttc ttccaaagac aagtaggaaa 4146C 
tacaaaaatt agccaggcat ggcacatgcc tgtagtcctg gttacttgga aggctgaagr -4 1520 
gggtggatcg cttgagccgg gaaggcagag gctgtagrga gctgagatca catcac:gca 4153C 
ctcaagcctg ggtgacagag caagaccctc tctggggaaa aaaaaaaaaa aaataggctg 4 1640 
ggcgcagtgg ctcacacttg taattccagc actttgggag gctgaggcag gtggtrcacc 4 1700 
tgaggtcagg agttctagac cagcctgacc aatatggtga aaccctgtct ctactaaaaa 41760 
tacaaaaatt agccaggcat ggtggtgggc aattgtaatc ctagctactc gggaggctga 4 1820 
ggcaggaaaa tcgcctgaac ccaagaggcg gaggtttcag tgagccgaga ttgcactag- 4 1880 
gcactccagc ctgggcgaca gagcaagact tcatctcaaa ataaataaat aagtaagtaa 4 1940 
ataaaattaa aaaatatata aaaataaaac aaagataagt aggaaccatc ctttttrttr 42000 
tttttttttt ttttttttaa agatagggtc tgtttctgat gcccaggctt gagtgtagtg 42060 
gcatgatcat ggctcactgc aaccttgacc tctcaaatac aagtgactct cctacctcag 42120 
cctcccaagt agctgggact acaggtgctt accaccccat ccggctcatt taaaaaaatr 42180 
tttttgtaga ggtggggtct cactatgttg tatccaggct ggtctcattt taactttat- 42240 
agaaaacaag cattgtttta tcagcttctt gtttttttaa aactaaaaat aacactgcta 42300 
ggttgtttct atgaagattc tctaaattta tttataacct taagaataac atgtagaaca 42360 
aagtagatga ctgaatgatc tttgttgaat aaatatgaat ggatartcaa ataatraaaa 42420 
atctcttaag atctcccatt ctttacagga tacagagaaa actcgttaat atggcctgac 42480 
ttttaccttt gcagccttat ccaaactctg tggtcaagac aaacaggttg tccttatact 42540 
tacaacgtcc ccctttgcct acaaagctct tctcatgact ctttgcctat cttaagttca 42600 
cctatctgtc aaatctctgg gaatgcaaca tttcctcaag gtagccttct ctcctcccaa 42660 
actagaacaa attcttcctg gggcattagg tttttattgc actgtatgtc tcttcttcac 42720 
agcaatcaca gttccaatgt tatatttgta ttcttagttg atttgtttct ttccaccttt 42780 
agactataac cttctaaggg gtcacacata atatcgatca tcagttgtat cccttgrgca 42840 
tagcacaggg catggcaggc aaatatgtgt gtaaataaac ttgttgaatg aatcaatgag 42900 
acacactttt cttacccaaa gtataatggc aggataacat ttatcaatct attgcttctt 42960 
gaaaaacaga tatgatgtgc ttaattttca ttttacatct caaataccaa tgcctaagga 43020 
attcacagtc attttacaaa tctttttgac aaatgccttc attaatcacc acctgtttac 43080 
aagtgctaaa taacattttg gttacattct gtaacatttc ctgcacttaa tgtcatctct 43140 
agaatactgg ctaatatgaa gcacctggac ttcaggaaca caaacctgaa actaacacac 43200 
caaactaaac tgttatgtaa atgacagaaa tgacacattt tggtctgcaa catctctaga 43260 
tggcttttgg accaattcaa cttttaccac taaaaatcgg tcacctgact atagtcattt 43320 
tgagctcatg ataaatgaat tacagatgaa aaataaatag tttgatgaca atctttacaa 43380 
aagtttatct tcaaagaata ccaccagtca caggtattct aggctcctan caactrattt 43440 
ggtcagggca gacttcactt ttcatgataa ttatgttctg aaaattctac aaacttaatg 43500 
attacaaaca aaagtcatag tttgctcata aatcaggcct aggtctggat tctagttctt 43560 
ccatttttca tttgttcact gaggcaagtg acttaaaatt ccctagcctc agtttcctca 43620 
catgtaaaat cagataatga ttcctattcc taagatggtt ttgaggcttc aacaagataa 43680 
gatgggcctc actcaagcat gctcagtact ctgtctctct ctctccggtt atgcagaaat 43740 
tctattagga ttctgcaaag taaaataaat atttcagtaa aaattatgcc ctttattaat 43800 
gaatctagat tttcagattt tccttaaatt tacttagtaa cttaagggct caaatattat 43860 
agagatttgt atctagtatt ttaaagaaat gaaaggtgtt aatcaaaatg ctgcacaaat 43920 
aaatgctaca tttaacaaac agaatatcac aaccatacaa actaatcaga tataaagaag 43980 
tcagcaacag aaatctgatg ttgcctttag atcacacaat taggcaaaca aaaatagagt 44040 
tccatcctcc tttggtcaag gccatggttg aagactgaat accaaatagg gaaataggaa 44100 
aagccaggaa atggcaaatt agcaaaaact ggactcctta atttttatat tcattttcat 44160 
atctcacttc taaaacttta attaaattca aataaaaacc aaaatggaac tgagataaag 44220 
ccaaaaggaa agttatgtag gtcaaatgag aacctatatt gtccttaggc tctttgttgc 44280 
tttctgttta aggaaaaact gcccaagtgc cttgacacat taaagatcaa gcaggaggtt 44340 
ctgccgagag tccccatctg gcagccaggt tttgtcaagc aaattttgag aattctctac 44400 
cctcccactt tctatctaat tatagcactt tataaaaacc attctctctc tgtctctgtc 44460 
tctctctctc tctctctctc acacacacac acacacacac acacacacac acacacaccc 44520 
tttctctctc tctctctctg aaacttatct gtattataat aacacaacac taggtatgga 44580 
ttaatctgac aattttcccc taaaacagaa taaattcaaa aaggaaaacc tttcctctgt 44640 
acacatgcac tatattctga caataataat tcctaaatta agtataatac attttcccta 44700 
caggagttta aagaagttac agtaaagaat ctcttgtata aatatatatg ccagaacttg 44760 
acccaaataa gtgctgagag gtataaatct caaaacagtt tccggactct ttgtgaaatg 44820 
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tcttcagagt ctgcgatata ttttcttcaa ctaaattata caagtaagat attttgctgg 44880 
gctgtgggaa tgccttacgg catgttactg tggagctcat ggtaaaatag aaagaatata 44940 
aataattaaa ataaaattga caaatgataa atgatttaat aaattagaaa ttcaaatgcc 45000 
gggcactttt ctagaacctg gacacaaagc atgaacctaa caataacccc gccttcatga 45060 
aaaatatgga ctatttgaaa attatacctg caacactaaa taaatattct tcattcttcc 45120 
agtatattga gatgtttact ttcaattaga caatttgctt tcctctctga acacatagtt 45180 
atgtgatggc tctataaaag attttaaaat aactatagaa ggaactattg gtaaagactg 45240 
tgggatacta aaaatggcta caaagaaagt tatgacaaaa cctctgagtt tgaatggaag 45300 
tcctactaga ttagagtcta agcctgtgac attatgcttc tggttcttgt tcttaaatgc 45360 
ttttctcatt aatagtatgt aacttacttc ctggaatgcc attcattaaa aaaatattta 45420 
atatttgcta aatgtcaata tttatgccag cacttttaaa gtacagaaac atggagtttc 45480 
tttacctcat gcaaatatgc tgtgagaaag acttaagagc ctattgccta ctttgtggta 45540 
caacactgaa gactcaccat ccaaaacaaa cagacttagt aaattcttgt gatttgcagt 45600 
agttctgttc tataaggtta ccacaaacac tgaaatcatc gctcctgggg gaatacaagg 45660 
ttatgtttcc gtgagccctc ggtcacaaca tgttcattaa ctgatcaata cataaccttg 45720 
ttctatgtgt gtttctgttt aaaaagagca cttcagtgct acatttggag tctgttttaa 45780 
acagcaaaat cactaataaa aagcacaaaa atgtaaaagc atggcactac atacactgtg 45840 
acaagaaggc ttgtttatag tatgacagct gagacaagaa ggtagagcct cgcrttgatc 45900 
aacctctgct gggaaatgag catcaggtga atcaattttt caccactctg aatgaccgta 45960 
aaagtgctcc aagtactgac tttggggtta cacataaatt ttagtaagca tgtgaatctg 46020 
ccaatatgaa atctacaaat aatgagtacc aaatgcatat gagtcaaata tttcagtgcg 4 6080 
gtatctgact tgattgccac tgaaagacac agtttggaaa acccctaata aataccgttt 46140 
agttactatg cagacaaaga gttctacact agagtgcttc aattaagatg tctgaggctt 4 6200 
tcataaatgg atgtttttta aaatgttatt tcctacctga tatattctaa aggggatata 46260 
acgaaatcca ttttcttctg caggatattc catgagtttc cgattgatgg cccaaaactg 46320 
gtcaaatctg tctgtaatga 46340 



<210> 67 
<211> 773 
<212> ADN 

<213> Homo sapiens 



<400> 67 

actgagagac 

gaaggtgacc 

gaaggtgacc 

caggtagtaa 

aatcaaatca 

aggcatttga 

gttttcactc 

aagctgagct 

gacttccacc 

cattgccact 

gttcatccta 

cagcttctaa 

atgaggccaa 



aggactagct 
acatccacct 
acaccctcct 
agagagctca 
tctatcgcct 
gccagatcag 
tattaaatct 
tttgctcgcc 
cctccggatc 
cccgatcagg 
atcaggctga 
tagagctata 
gaaccccagg 



ggatttccta 
ttaaacacgg 
ttaaacacag 
ctaaaatacc 
gagagcacag 
gtaaccctct 
tgcaactgca 
gtccaccact 
cggcagagtg 
ctaaaggctt 
acactggtcg 
acactcacca 
tcagagaata 



ggctgactaa 
ggcttgcaac 
agcttgtaac 
aattaggcta 
ggggagggac 
ttgggtcccc 
cactcttctg 
gctgaatgcc 
tccgctgcac 
gccattgttc 
ctgggttcca 
catggcccaa 
aaaggcccgc 



gaatccctaa 
ttagctcaca 
tcagctcaca 
aaaacaggag 
aatgat cggg 
tcacactgta 
gtccatgttt 
gccattgcag 
tcctgatcca 
ctgcacagct 
cggttctctt 
ggttccattc 
cccatcttgg 



gcctagctgg 
cctgaccaag 
cccgaccaat 
gtaaagaaat 
at ataaaccc 
tgggagctct 
gttccggctc 
acctgccctt 
gcgaggcacc 
aagtgcctgg 
ccatgactca 
gttggaatcc 
gag 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

773 



<210> 68 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 68 

Phe Leu Gly Glu Glu Cys Cys Tyr Tyr Val 
15 10 
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<210> 69 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 69 

Leu Leu Phe Gly Pro Cys lie Phe Asn Leu 
1*5 10 



<210> 70 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 70 

Cys Leu Pro Leu Asn Phe Arg Pro Tyr Val 
15 10 



<210> 71 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 71 

Gly Leu Leu Ser Gin Trp Met Pro Trp lie 
15 10 



<210> 72 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 72 

Cys Leu Pro Ser Gly lie Phe Phe Val 
1 5 



<210> 73 
<211> 9 
<212> PRT 

<213> Homo sapiens 



<400> 73 

Trp Met Pro Trp lie Leu Pro Phe Leu 
1 5 
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<210> 74 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 74 

lie Arg Trp Val Thr Pro Pro Thr Gin lie 
1 5 10 



<210> 75 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 75 

Leu Arg Asn Thr Gly Pro Trp Gly Leu Leu 
15 10 



<210> 76 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 76 

Leu Arg Thr His Thr Arg Leu Val Ser Leu 
1 5 10 



<210> 77 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 77 

Lys Arg Val Pro lie Leu Pro Phe Val lie 
15 10 



<210> 78 
<211> 10 
<212> PRT 

<213> Homo sapiens 



<400> 78 

Cys Arg Cys Met Thr Ser Ser Ser Pro Tyr 
1 5 10 
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<210> 79 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 79 

Thr Arg Val His Gly Thr Ser Ser Pro Tyr 

15 10 



<210> 80 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 80 

Ala Arg Glu Lys His Val Lys Glu Val lie 
15 10 



<210> 81 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 81 

Ser Arg lie Glu Ala Val Lys Leu Gin Met 
15 10 



<210> 82 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 82 

Ser Gin Trp Met Pro Trp lie Leu Pro Phe 
15 10 



<210> 83 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 83 

Cys Tyr Tyr Val Asn Gin Ser Gly lie 
1 5 
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<210> 84 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 84 

Phe Tyr Tyr 'Lys Leu Ser Gin Glu Leu 
1 5 



<210> 85 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 85 

Thr Tyr Thr Thr Asn Ser Gin Cys lie 
1 5 



<210> 86 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 86 

Ser Phe Leu Val Pro Pro Met Thr lie 
1 5 



<210> 87 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 87 

Tyr Tyr Val Asn Gin Ser Gly lie Val 
1 " 5 



<210> 88 
<211> 9 
<212> PRT 

<213> Homo sapiens 



<400> 88 

Leu Phe Asn Thr Thr Leu Thr Gly Leu 
1 5 
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<210> 89 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 89 

Leu Phe Gly Pro Cys lie Phe Asn Leu 
1 5 



<210> 90 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 90 

Arg Trp Val Thr Pro Pro Thr Gin lie 
1 5 



<210> 91 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 91 

Leu Pro Phe Leu Gly Pro Leu Ala Ala lie 
15 10 



<210> 92 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 92 

Leu Pro Tyr His lie Phe Leu Phe Thr Val 
15 10 



<210> 93 
<211> 10 
<212> PRT 
<213> Homo 



sapiens 



<400> 93 

Gly Ala Leu Gly Thr Gly He Gly Gly He 
15 10 
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<210> 94 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 94 

Leu Pro Phe Val He Gly Ala Gly Val Leu 
15 10 



<210> 95 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 95 

Arg Arg Pro Leu Asp Arg Pro Ala Ser 
1 5 



<210> 96 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 96 

Phe Arg Pro Tyr Val Ser He Pro Val 
1 5 



<210> 97 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 97 

Arg Arg Ala Leu Asp Leu Leu Thr Ala 
1 ~ 5 



<210> 98 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 98 

Trp Arg Met Gin Arg Pro Gly Asn He 
1 5 
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<210> 99 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 99 

Asp Arg lie Gin Arg Arg Ala Glu Glu Leu 
15 10 



<210> 100 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 100 

Leu Arg Thr His Thr Arg Leu Val Ser Leu 
1 " 5 10 



<210> 101 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 101 

Glu Arg Val Ala Asp Ser Leu Val Thr Leu 
15 10 



<210> 102 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 102 

Leu Phe Gly Pro Cys lie Phe Asn Leu Leu 
1 5 10 



<210> 103 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 103 

Gin Phe Tyr Tyr Lys Leu Ser Gin Glu Leu 
15 10 
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<210> 104 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 104 

Gin Trp Met Pro Trp lie Leu Pro Phe Leu 
15 10 



<210> 105 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 105 

Cys Tyr Tyr Val Asn Gin Ser Gly lie Val 
1 5 10 



<210> 106 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 106 

Asn Phe Val Ser Ser Arg lie Glu Ala Val 
15 10 



<210> 107 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 107 

Gly Pro Leu Val Ser Asn Leu Glu lie 
1 5 



<210> 108 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 108 

Leu Pro Leu Asn Phe Arg Pro Tyr Val 
1 5 
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<210> 109 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 109 

Leu Pro Phe Leu Gly Pro Leu Ala Ala lie 
15 10 



<210> 110 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 110 

Glu Pro Lys Met Gin Ser Lys Thr Lys lie 
1 * 5 "* 10 



<210> 111 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 111 

Leu Pro Tyr His lie Phe Leu Phe Thr Val 
15 10 



<210> 112 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 112 

Arg Glu Lys His Val Lys Glu Val lie 
1 5 



<210> 113 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 113 

Lys Pro Arg Asn Lys Arg Val Pro lie Leu 
15 10 
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<210> 114 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 114 

Val Val Leu Gin Asn Arg Arg Ala Leu 
1 5 



<210> 115 

<211> 10 

<212> PRT 

<213> Homo sapiens 

<400> 115 

Ala Val Val Leu Gin Asn Arg Arg Ala Leu 
15 10 



<210> 116 

<211> 9 

<212> PRT 

<213> Homo sapiens 

<400> 116 

Leu Pro Phe Val He Gly Ala Gly Val 
1 5 



<210> 117 

<211> 9 

<212> PRT 

<213> Homo sapiens 

<400> 117 

Asp Leu Tyr Ser Tyr Val He Ser Lys 
1 5 



<210> 118 

<211> 10 

<212> PRT 

<213> Homo sapiens 



<400> 118 

Thr Glu Gin Asp Leu Tyr Ser Tyr Val He 
15 10 



WO 99/67395 



PCT/FR99/01513 



83 



<210> 119 
<211> 2615 
<212> ADN 

<213> Homo sapiens 



<400> 119 

gaattccggg 

agtgttgcgg 

gcccgggcgg 

gcactgtgag 

ggatgcggat 

gaacgaccac 

cttaccaagg 

gagtaaagaa 

caatgacaca 

ggagcttcac 

gaatccagca 

ctacttctac 

ggactttgca 

acaaacacag 

tgtcccaaag 

aggaaaggac 

ctttagaaga 

ggcccctctg 

gtacatcact 

ccccgaccaa 

tgtgggcccc 

cacggaaggt 

catcccctcg 

taatggcctg 

gctgtgccct 

ccccacttct 

gcatcccagg 

cgccagcatg 

cgccacggca 

cagcgacgaa 

tccctacccg 

gactttcggc 

tttcaaatgt 

cctggtacac 

caccagcaat 

ggtgtgccct 

ccgggagcgg 

caaggttcac 

tctgacccga 

cgaggacgtg 

ggtcagaaaa 

tggactcctc 

gcctcccagc 

aatggatcct 



aagccagacg 
agaggcaaga 
ccggacgaag 
gtttcaggga 
atgactctgt 
ccctgggatt 
aatctgcttt 
tacataccaa 
gttcctaaga 
cacttcattg 
cactctcccc 
accattaagc 
gaaaggcttc 
agcagtctaa 
agagagtaca 
ctctaccgtt 
cgtgggagcc 
ccagaagact 
cgctccccca 
agcctcaaga 
ggctctcaag 
ttgggctcct 
tacaacgctc 
agcgctgtga 
gtctacagca 
ctcccgagct 
gaggtgcttg 
aaggacaagg 
gaacatgtgg 
gccatgaatc 
ctgaagaagc 
cagctctcca 
cagacttgca 
acgggagaaa 
ctcaagaccc 
gccaagttca 
ccccacaagt 
ctgaaaggga 
atcaatgaag 
gaggatgaca 
gagaaagaag 
tcctcagggt 
aacccactac 
taagattttc 



gttaacacag 
gcagcgaccg 
cgaggaggga 
ttggcagagg 
ggacagaggc 
ctggtgctga 
tcaagtatgc 
agggcacacg 
acgccaacag 
acggctttaa 
gggagcaaaa 
ccatccctgc 
actaccctta 
agcaaccgag 
gcgtgaaaga 
ctaacatttc 
ccgaaatgcc 
ttttgaaagc 
ttccatcctc 
gctccagccc 
agcaccggga 
accctggcta 
actaccccaa 
gcagcatgaa 
atctcctcgg 
cgctgccctc 
tcccggcgcc 
cctgtagccc 
tgcagcccaa 
tcattaaaaa 
agaacggcaa 
atctgaaggt 
acaagggctt 
agccacatga 
acctgcgact 
cccagtttgt 
gctcccagtg 
actgcgctgc 
aaatcgagaa 
tcagtgtgat 
aaactggcct 
gcagccttta 
ctctggtacc 
agaaaacact 



acaaagtgct 
cgcacctgtc 
ccgccgaggc 
ggaccaaggg 
tgagtttgaa 
tggcggtact 
caccaacagt 
ttttggaccc 
gaaatatttt 
tgaagagaaa 
cctggctgcg 
caaccaggaa 
tcccggagag 
cactgagaaa 
aatcctaaaa 
acccctcaca 
cttctaccct 
ttccctggcc 
caccactcca 
tcacagcagc 
ctcctacgct 
cgcacccctg 
gttcctcttg 
tggcatcaac 
tgggggcagc 
agatggagcc 
ccacagtgcc 
cacaagcggg 
agctacctca 
caaaagaaac 
gatcaagtac 
ccacctgaga 
tactcagctc 
atgccaggtc 
ccattctgga 
gcacctgaaa 
ccacaagaac 
ggccccggcg 
gtttgacatc 
ctctgtagtg 
gaaagtgtct 
tgagtcatca 
tgtaaaggtc 
tattt 



gccgtgacac 
cgcccggagc 
tgcccccaag 
gacatgaaaa 
gagaagtgta 
tcggttcagg 
gaagaggtta 
ctaataggtg 
tggaggatct 
agcaactgga 
tgtcagaacg 
cttcttgtgt 
ctgacaatga 
aatgaactct 
ttggactcca 
tcagaaaagg 
cgggtcgttt 
tacgggatcg 
agcccctctg 
cctgggaata 
tacttgaacg 
ccccacctcc 
cccccctacg 
aactttggcc 
ctgccccacc 
cggaggttgc 
ttctccttta 
tctcccacgg 
gcagcgatgg 
atgaccggct 
gaatgcaacg 
gtgcacagtg 
gcccacctgc 
tgccacaaga 
gagaaaccat 
ctgcacaagc 
tacatccatc 
cctgggctgc 
agtgacaatg 
gagaaggaaa 
ttgcaaagaa 
gatctacccc 
aaacaagaaa 



tcggccctcc 
tgggacgcgc 
tgtaactcca 
tggacatgga 
catacattgt 
cggaggcatc 
ttggagtgat 
aaatctacac 
attccagagg 
tgcgctatgt 
ggatgaacat 
ggtattgtcg 
tgaatctcac 
gcccaaagaa 
acccctccaa 
acctcgatga 
accccatccg 
agagacccac 
caagaagcag 
cggtgtcccc 
cgtcctacgg 
cgccagcttt 
gcatgaattg 
tcttcccgag 
ccatgctcaa 
tccagccgga 
ccggggccgc 
cgggaacagc 
cagcccccag 
acaagaccct 
tttgcgccaa 
gagaacggcc 
agaaacacta 
gatttagcag 
accaatgcaa 
gtctgcacac 
tctgtagcct 
ccttggaaga 
ctgaccggct 
ttctggccgt 
acatggggaa 
tcatgaagtt 
cagttgaacc 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2615 



<210> 120 
<211> 29 
<212> PRT 

<213> Homo sapiens 
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<400> 120 

Leu Gin Asn Arg Arg Ala Leu Asp Leu Leu Thr Ala Glu Arg Gly Gly 
15 10 15 

Thr Cys Leu Phe Leu Gly Glu Glu Cys Cys Tyr Tyr Val 
20 25 



<210> 121 
<211> 21 
<212> ADN 

<213> Homo sapiens 
<400> 121 

cttcaaacaa caaccaggag g 21 



<210> 122 
<211> 20 
<212> ADN 

<213> Homo sapiens 



<400> 122 

ttggggaggt tggccgacga 



20 
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0 Categories sp^ciales de documents cites: 

"A" document definissant I'etat general de la technique, non 

considere comme particulierement pertinent 
"E" document anterieur, mais publie a la date de depot international 

ou apres cette date 
"L" document pouvant jeter un doute sur une revendication de 

priorite ou cite pour determiner la date de publication d'une 

autre citation ou pour une raison speciale (telle qu'indiquee) 
"O" document se referant a une divulgation orale, a un usage, a 

une exposition ou tous autres moyens 

"P" document publie avant la date de depdt international, mais 
posterieurement a la date de priorite revendiquee 



"T" document ulterieur publie apres la date de d6p6t international ou la 
date de priorite et n'appartenenant pas a I'etat de la 
technique pertinent, mais cite pour comprendre le principe 
ou la theorie constituant la base de I'invention 

"X" document particulierement pertinent; I'inven tion revendiquee ne peut 
etre consideree comme nouvelle ou comme impliquant une activity 
inventive par rapport au document considere isolement 

"Y" document particulierement pertinent; I'inven tion revendiquee 

ne peut etre consideree comme impliquant une activite inventive 
lorsque le document est associe a un ou plusieurs autres 
documents de meme nature, cette combinaison etant evidente 
pour une personne du metier 

"&" document qui fait partie de ia meme famille de brevets 



Date a laquelle la recherche internationale a ete effectivement achevee 

18 octobre 1999 


Date d' expedition du present rapport de recherche internationale 

11 tL 99 


Nom et adresse postale de ('administration chargee de la recherche internationale 
Office Europeen des Brevets, P.B. 5818 Patentlaan 2 
NL - 2280 HV Rijswijk 
Tel. (+31-70) 340-2040, Tx. 31 651 epo nl, 
Fax: (+31-70) 340-3016 


Fo notion naire autorise 

Cupido, M 



Foimulaire PCT/ISA/210 (deuxidme feuilie) <]uillet 1992) 
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RAPPORT DE RECHERCHE INTERNATIONALE 



Derru 



Internationale No 



PCT/FR 99/01513 



C.(sulte) DOCUMENTS CONSIDERES COM ME PERTINENTS 



Categoric j Identification des documents cites, avecje cas echeant, I'indlcationdes passages pertinents 



no. des revendications visees 



p,x 



p,x 



P,X 



ALLIEL PM ET AL: "Sequences retrovi rales 
endogenes anlogues a celle du nouveau 
retrovirus MSRV associe a la sclerose en 
plaques ( premiere parti e)" 
COMPTES RENDUS DES SEANCES DE L'ACADEMIE 
DES SCIENCES SERIE III: SCIENCES DE LA 
VIE. , 

vol. 321, no. 6, juin 1998 (1998-06), 
pages 495-499, XP002101380 
MONTREUIL FR 
figures 2,3 

Database GenBank Sequence AC X93499 
mRNA de H. sapiens pour la proteine rab7 
10 fevrier 1997 
XP002119234 

6 VITELLI R ET AL: "Molecular cloning and 
expression analysis of the human rab7 
GTP-ase complementary deoxyribonucleic 
acid" 

BIOCHEMICAL AND BIOPHYSICAL RESEARCH 
COMMUNICATIONS, 

vol. 229, no. 3, 1996, pages 887-890, 
ORLANDO, FL US 

FR 2 737 500 A (BIO MERIEUX) 

7 fevrier 1997 (1997-02-07) 
cite dans la demande 

le document en entier 

WO 99 02666 A (BIO MERIEUX) 

21 janvier 1999 (1999-01-21) 

Comparez SEQ ID NOs 130, 117, 114 et 120 

avec SEQ ID NOs : 1-3 de cette demande et 

SEQ ID NO: 118 avec SEQ ID NOs: 22 et 120 de 

cette demande 

W0 99 02696 A (BIO MERIEUX ;BESEME 
FREDERIC (FR); BLOND JEAN LUC (FR); BOUTON 
OLD 21 janvier 1999 (1999-01-21) 
Comparez SEQ ID NOs: 4, 5, 7, 9 et 11 avec 
SEQ ID NOs: 1-3 de cette demande. 

ALLIEL PM ET AL: "Retrovirus endogenes et 
sclerose en plaques. II. HERV-7q" 
COMPTES RENDUS DES SEANCES DE L'ACADEMIE 
DES SCIENCES SERIE III: SCIENCES DE LA 
VIE., 

vol. 321, no. 10, octobre 1998 (1998-10), 

pages 857-863, XP002101381 

MONTREUIL FR 

le document en entier 

-/~ 



1,3-12, 
14-36 



1-4 



1,3-12, 
14-36 



1,3-12, 
14-36 



1,3-12, 
14-36 



1,3-12, 
14-36 



Formulalre PCT/ISA/21 0 (slits de la deuxteme feuiUe) Quillet 1 992) 
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RAPPORT DE RECHERCHE INTERNATIONALE 



Dema Internationale No 

PCT/FR 99/01513 



C.(suite) DOCUMENTS CONSIDERES COM ME PERTINENTS 



Categorie 



Identification des documents cites, avec,le cas echeant, I'lndicationdes passages pertinents 



no. des revendications visees 



p,x 



WO 99 26972 A (GENETICS INSTITUTE, INC.) 
3 juin 1999 (1999-06-03) 
comparez SEQ ID NO: 4 avec a. a. 131-668 de 
sequence 22 de cette demande 

MITANI M ET AL: "Suppressive effect on 
polyclonal B-cell activation of a 
synthetic peptide homologous to a 
transmembrane component of oncogenic 
retrovirus" 

PROCEEDINGS OF THE NATIONAL ACADEMY OF 
SCIENCES OF USA, 

vol. 84, no. 1, janvier 1987 (1987-01), 

pages 237-240, XP002118729 

WASHINGTON US 

cite dans la demande 

le document en entier 



1-4 



24,25 



Fonnulaire PCT/ISA/210 (suite de la deuxieme feuille) (juillet t992) 
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RAPPORT DE RECHERCHE INTERNATIONALE 



D ande intemationaie n° 

PCT/FR 99/01513 



Cadre t Observations - lorsqu'il a ete estime que certaines revendications ne pouvaient pas faire I'objet d'une recherche 
(suite du point 1 de ia premiere feuilie) 



Conformement a i'article 17.2)a), certaines revendications n'ont pas fait I'objet d'une recherche pour les motifs suivants: 

1 . | I Les revendications n°* 

se rapportent a un objet a regard duquel ('administration n'est pas tenue de proceder a la recherche, a savoir: 



2. | ^ | Les revendications n 08 8 

se rapportent a des parties de ia demande intemationaie qui ne remplissent pas suffisamment les conditions present es pour 
qu'une recherche significative puisse etre effectuee, en particulier: 

voir feuilie supplementaire SUITE DES RENSEIGNEMENTS PCT/ISA/210 



3-D 



Les revendications n os 

sont des revendications dependantes et ne sont pas redigees conformement aux dispositions de ia deuxieme et de ia 
troisieme phrases de la regie 6.4.a). 



Cadre li Observations - lorsqu'il y a absence d'unite de llnvention (suite du point 2 de la premiere feuilie) 



L'administration chargee de la recherche intemationaie a trouve plusieurs inventions dans la demande intemationaie, a savoir: 

voir feuilie supplementaire 



1 . I I Comme toutes les taxes additionnelles ont ete payees dans ies delais par le deposant, ie present rapport de recherche 
' ' intemationaie porte sur toutes les revendications pouvant faire I'objet d'une recherche. 

Comme toutes les recherches portant sur les revendications qui s'y pretaient ont pu etre effectuees sans effort particulier 
justifiant une taxe additionneile, l'administration n'a sollicite le paiement d'aucune taxe de cette nature. 



3. Comme une partie seufement des taxes additionnelles demandees a ete payee dans ies delais par le deposant, le present 

' ' rapport de recherche intemationaie ne porte que sur les revendications pour lesquelles les taxes ont ete payees, a savoir 

les revendications n 08 



4. | I Aucune taxe additionneile demandee n'a ete payee dans les delais par ie deposant. En consequence, te present rapport 

' ' de recherche intemationaie ne porte que sur ('invention mentionnee en premier lieu dans les revendications; elle est 

couverte par ies revendications n os 



Remarque quant a la reserve [ j Les taxes additionnelles etaient accompagnees d'une reserve de la part du deposan . 

| j Le paiement des taxes additionnelles n'etait assorti d'aucune reserve. 



Formulaire PC771SA/210 (suite de la premiere feuilie (1)) (Juillet 1998) 



Demande Internationale No. PCT/FR 99/01513 



SUrTE DES RENSEIGNEMENTS INDIQUES SUR PCT/ISA/ 210 



Suite du cadre 1.2 
Revendi cations nos.: 8 



Le revendi cation 8 presente a trait a une tres grande variete de 
composes. Un fondement au sens de L' Article 6 PCT et un expose au sens de 
1 'Article 5 PCT ne peut cependant etre trouve que pour un nombre tres 
restreint de ces composes revendiques. Dans le cas present, les 
revendi cations manquent a un tel point de fondement et 1 'expose de 
1'invention dans la description est si limite q'une recherche 
significative couvrant tout le spectre revendique est impossible. 

L' attention du deposant est attiree sur le fait que les revendi cations, 
ou des parties de revendi cations, ayant trait aux inventions pour 
lesquelles aucun rapport de recherche n'a ete etabli ne peuvent faire 
obligatoirement 1'objet d'un rapport preliminaire d'examen (Regie 66.1(e) 
PCT). Le deposant est avert i que la ligne de conduite adoptee par 1'OEB 
agissant en qualite d'admini strati on chargee de 1'examen preliminaire 
international est, normal ement, de ne pas proceder a un examen 
preliminaire sur un sujet n'ayant pas fait l'objet d'une recherche. Cette 
attitude restera inchangee, independamnent du fait que les revendi cations 
aient ou n'aient pas ete modifiees, soit apres la reception du rapport de 
recherche, soit pendant une quelconque procedure sous le Chapitre II. 



Demand© Internationale No. PCT/FR 99/01513 



SUITE DES RENSEIGNEMENTS INDIQUES SUR PCT/ISA/ 210 



L 1 administration chargee de la recherche internationale a trouve 
plusieurs (groupes d 1 ) inventions dans la demande internationale, a 
savoir: 

1. revendi cations: 1, 9, 21-23, 26 (complet), 28, 
10-20 et 27-37 (partiellement) 



Fragments d'acide nuclei que derive du HERV-7q env, reactifs 
de diagnostic, applications et kits diagnostiques, peptides, 
compositions et applications pharmaceutiques, anti corps et 
animaux transgeniques correspondants. 



2. revendi cations: 2-7, 10-20, 27-37( tous partiellement) 

Fragments d'acide nuclei que derive du HERV-7q gag, reactifs 
de diagnostic, applications et kits diagnostiques, peptides, 
compositions et applications pharmaceutiques, anti corps et 
animaux transgeniques correspondants. 



3. revendi cations: 2-7, 10-20, 27-37( tous partiellement) 

Fragments d'acide nucleique humaines similaires a HERV-7q 
(SEQ ID NOs: 4-21 et 61), reactifs de diagnostic, 
applications et kits diagnostiques, peptides, compositions 
et applications pharmaceutiques, anti corps et animaux 
transgeniques correspondants. 



4. revendi cations: 24, 25 

Compositions comprenant un motif de type CKS, dans la mesure 
ou ces compositions ne contiennent pas une sequence selon la 
premiere invention. 



RAPPORT DE RECHERCHE INTERNATIONALE 

Renseignements relatifs aux ..embres de families de brevets 



Demanr itemationaie No 

PCT/I-R 99/01513 



Document brevet cite 


Date de 


Membre(s) de la 


Date de 


au rapport de recherche 


publication 


famiile de brevet (s) 


publication 



WO 9823755 



04-06-1998 



EP 



0942987 A 



22-09-1999 



FR 2737500 A 07-02-1997 



AU 


6823296 


A 


05- 


-03- 


1997 


BG 


101355 


A 


30- 


-12- 


1997 


BR 


9606566 


A 


30- 


-12- 


1997 


CA 


2201282 


A 


20- 


-02- 


1997 


CZ 


9701357 


A 


17- 


-06- 


1998 


EP 


0789077 


A 


13- 


-08- 


1997 


WO 


9706260 


A 


20- 


-02- 


1997 


HU 


9900425 


A 


28- 


-05- 


1999 


JP 


11502416 


T 


02 


-03- 


1999 


NO 


971493 


A 


03 


-06- 


1997 


NZ 


316080 


A 


29 


-04- 


1999 


PL 


319512 


A 


18 


-08- 


1997 


SK 


56797 


A 


09 


-09- 


•1998 



WO 


9902666 


A 


21-01-1999 


FR 


2765588 A 


08-01-1999 










AU 


8545098 A 


08-02-1999 


W0 


9902696 


A 


21-01-1999 


AU 


8447098 A 


08-02-1999 


W0 


9926972 


A 


03-06-1999 


AU 


1417899 A 


15-06-1999 



Formulaire PCT/ISA/210 (annexe families de brevets) (juillet 1992) 



